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Avant-propos 


Cet aide-mémoire expose les principaux éléments de la théorie des pro- 
babilités, de la théorie des processus aléatoires et de la statistique mathé- 
matique (définition des notions, axiomes, théorèmes, formules) de même 
qu'il décrit les principales méthodes et idées utilisées dans les raisonnements 
probabilistes (fonctions caractéristiques et transformations de Laplace, 
représentations spectrales des processus aléatoires stationnaires et des 
champs homogènes, méthode des équations différentielles en théorie des 
processus markoviens, continuité absolue des mesures en statistique des 
processus aléatoires, etc.). Les méthodes probabilistes sont illustrées sur des 
exemples simples qui permettent au lecteur de résoudre seul des problèmes 
pratiques en les ramenant à un schéma connu et en se servant des méthodes 
décrites. L'aide-mémoire couvre un vaste domaine et peut être utile aussi 
bien aux lecteurs désireux d'utiliser les résultats sans se soucier de leurs 
démonstrations, qu'aux spécialistes dans leurs recherches. 

L'aide-mémoire cest divisé en trois parties consacrées respectivement à 
la théorie des probabilités, à la théorie des processus aléatoires et à la statis- 
tique mathématique. La première partie contient les définitions fondamen- 
tales : espace probabilisé, variable aléatoire, espérance mathématique, 
probabilité conditionnelle et espérance mathématique ; elle traite de même 
des suites d'événements et de variables indépendants, des chaînes de Markov 
et décrit les méthodes analytiques utilisées dans les théorèmes limites pour 
les sommes de variables aléatoires indépendantes. 

La deuxième partie est consacrée aux notions fondamentales de la 
théorie des processus et champs aléatoires ainsi qu'aux problèmes généraux 
de cette dernière : théorie de l'espace L,, étude de l’absolue continuité des 
mesures associées à des processus aléatoires, théorèmes limites pour pro- 
cessus aléatoires. Elle aborde en outre les plus importantes classes de pro- 
cessus aléatoires : martingales, processus stationnaires au sens strict et lar- 
ge, champs homogènes et isotropes, processus markoviens, processus à 
accroissements indépendants, processus branchus, équations différentielles 
stochastiques. 

La troisième partie expose les notions fondamentales de la statistique 
mathématique, de même que les méthodes de test des hypothèses statistiques 
et de construction d'estimation des paramètres des lois de probabilité. On y 
trouve les éléments d’une branche aussi nouvelle que la statistique des pro- 
cessus aléatoires. 


Etant donné le nombre de pages imposées, il a été impossible d'inclure 
de vastes problèmes appliqués de statistique mathématique (notamment les 
tables statistiques). L'examen de ces questions aurait en effet doublé le 
volume de cet ouvrage. Aussi la partie réservée à la statistique ne compor- 
te-t-elle que les faits les plus indispensables, de nature foncièrement théori- 
que. 

La théorie de la fiabilités, les jeux stochastiques et les automates, la 
théorie des files d'attente et autres domaines appliqués n'ont été esquissés 
que pour mieux illustrer les notions fondamentales de la théorie des pro- 
babilités et de la théorie des processus aléatoires. 

La lecture de l'aide-mémoire peut être faite dans l'ordre qui convient 
le micux aux besoins de l'utilisateur. Un index alphabétique a été inclus 
pour la commodité du lecteur. Ceux qui désirent approfondir un aspect 
ou une démonstration des propositions données trouveront une biblio- 
graphie à la fin de l’ouvrage. 

Dans la conception de cet aide-mémoire les tâches ont été réparties 
comme suit : les chapitres 3, 7, 10, 13, 18, 20 ont été écrits par V. Koro- 
liouk ; les chapitres 2, 8, 14, 15, 19, 21, 22 par N. Portenko ; les chapitres 1, 
5,9, 12, 16, 24 par A. Skorokhod ; les chapitres 4, 6, 11, 17, 23, 25 par 
A. Tourbine. 

Les auteurs conçoivent que tant la forme que le contenu de cet ouvrage 
ne sont pas dénués d’imperfections. Aussi toutes les remarques et suggestions 
seraient-elles accueillies avec empressement. 

Les auteurs tiennent à exprimer leur profonde gratitude à N. Riabov et 
à L. Lobanov pour l'aide apportée à la préparation du manuscrit. 


Les auteurs 


PREMIÈRE PARTIE 


Théorie des probabilités 


Chapitre premier 


ESPACE PROBABILISÉ 


1.1. Expérience aléatoire 


1.1.1. Définition d’une expérience aléatoire. En théorie des probabilités 
la notion d'expérience revêt une signification assez vaste. Une expérience®*) 
est définie par un ensemble de conditions qui sont réunies soit artificielle- 
ment, soit indépendamment de l'expérimentateur, et par les résultats (ou 
issues) de cette expérience, c'est-à-dire les événements observés au terme de 
la réalisation de cet ensemble de conditions. Une expérience est définie par 
la donnée de ses conditions et par l'indication des événements dont on 
observe la réalisation ou la non-réalisation. 

Les expériences se divisent grosso modo en deux classes. Dans la 
première, les conditions de l'expérience définissent de façon unique la réali- 
sation (ou la non-réalisation) des événements possibles. Ces expériences 
dont les résultats sont prévisibles par des lois naturelles sont dites déter- 
ministes. Dans la deuxième classe, les mêmes conditions peuvent donner 
lieu à des événements s’excluant mutuellement. L'étude théorique de ces 
expériences dites aléatoires ou probabilistes fait précisément l’objet de la 
théorie des probabilités. 

Citons quelques exemples d'expériences aléatoires sortant du domaine 
des jeux de hasard. 

Exemple 1. Des articles sont produits par lots de n pièces. Les piè- 
ces contrôlées sont mises au rebut. Aussi pour tester un lot, choisit-on 1 
pièces (71 < n). Une expérience consiste à tirer 1 pièces dans chaque lot. 
Le résultat de l'expérience est le nombre de pièces défectueuses trouvées. 

Exemple 2. Le tirage d’une loterie peut être considérée comme une 
expérience aléatoire dont le résultat est le lot gagné par tel ou tel billet. 

Exemple 3. On considère la pollinisation directe d'une plante 
obtenue par poilinisation croisée. La plante a hérité des gènes des deux 


°) On dit aussi une épreuve. 


parents (4 et B). On ne sait par avance comment seront combinés les gènes 
dans chaque graine obtenue par pollinisation directe. Trois combinaisons 
sont possibles : 44, AB, BB. Donc, cette expérience peut être considérée 
comme une expérience aléatoire. 

Exemple 4. Une particule en suspension dans un liquide se déplace 
sous l'effet des chocs avec les molécules de liquide en agitation thermique 
chaotique. L'observation du mouvement de cette particule peut être con- 
sidérée comme une expérience aléatoire dont le résultat est la trajectoire du 
mouvement brownien de cette particule. 


1.1.2. Algèbre d'événements. Considérons un ensemble Y? d'événements 
observables dans une expérience aléatoire. Il est possible de définir des opé- 
rations sur ces événements. Commençons par distinguer deux événements 
particuliers : l'événement certain U qui a lieu pour toute réalisation de 
l'expérience ct l'événement impossible F qui n'a lieu pour aucune réalisation 
de l'expérience. 

A chaque événement À de 9} associons l'événement contraire À, c'est-à- 
dire la non-réalisation de A. On appelle union (ou disjonction) des événe- 
ments À et Bet on note À + B(AUB), l'événement qui consiste en la réa- 
lisation de À ou de B (ou éventuellement des deux à la fois) ; on appelle 
produit (ou intersection ou conjonction) des événements 4 et B et l'on note 
AB(AN B) l'événement qui consiste en la réalisation simultanée de 4 et 
de 2. 

Deux événements À et B sont incompatibles (ou disjoints) si ANB 
est impossible. L'événement 42 est appelé différence des événements 4 et B 
ct noté À — B. 

Des événements E;, E,, ... E, forment un système complet d’événe- 


ments s'ils sont deux à deux incompatibles et U E, = U, c'est-à-dire l'un au 
L ] 


moins de ces événements est réalisé. 

On dit qu'un ensemble d'événements non vide % est une algèbre 
d'événements si : 

1) AEÇU => AE ; 

2) A, BEN —= AUBEN. 


1.1.3. Evénements élémentaires. On dit qu’un événement À entraîne un 
événement B (et l’on note 4 & B) si la réalisation de l'événement À implique 
automatiquement celle de B. Un événement E est élémentaire (ou est 
une éventualité) si pour tout événement À attaché à une expérience aléatoire 
l'événement E implique soit À soit À. On dit qu'une expérience aléatoire est 
finie si elle donne lieu à un système complet d'événements élémentaires. 
La théorie des probabilités n'envisage que des expériences aléatoires dans 
lesquelles chaque événement est l'union de tous les événements élémentaires 
qui l'impliquent. Une telle expérience est décrite par un ensemble d'éven: 
tualités {2 (dont les éléments sont désignés par la lettre « affectée d'indices 
différents : w’, &’’, w!, w,, etc.) et par une classe Ÿ de parties de 2 (dites 
événements possibles) tels que : 


à 


1) AEUN (A est l'événement certain, sa réalisation est cntrainée par 
celle de tout événement élémentaire) ; 

2) A contient l'ensemble vide @ qui est interprété comme un événe- 
ment impossible ; 

3) si À E À, alors 2 — 4 E À, (2 — À étant l'événement contraire de À ; 

4) ACEU, BEU => AUBet ANBEU ; 

On appelle algèbre d’ensembles une classe Y de parties de {2 vérifiant 
les conditions 1 à 4. 

Si 9 est fini, A est confondue avec la classe de toutes les parties de £2. 

La mesure d'une quantité £ est un important exemple d'expérience 
aléatoire. Pour éventualités, on peut prendre les événements de la forme 
{£ = x}, où x est une valeur donnée. Il est donc naturel d'identifier l'ensem- 
ble des éventualités à l’ensemble des points de la droite. Si l’on sait à priori 
que & ne peut prendre que les valeurs d’un ensemble AA, c'est cet ensemble 
qui sera l’ensemble des éventualités. On admettra qu'il est possible d'ob- 
server l'événement {a = £ < b}, où a et b sont des nombres arbitraires. 
Les sommes finies de tels intervalles (a et b sont susceptibles de prendre des 
valeurs infinies) peuvent être considérées comme l'algèbre des événements 
attachés à cette expérience. 


1.2. Axiomes et propriétés fondamentales des probabilités 


1.2.1. Fréquences des événements. Une caractéristique essentielle des 
expériences aléatoires est la possibilité de les répéter un grand nombre de 
fois (en principe indéfiniment). Si Q est l'ensemble des événements élémen- 
taires attachés à une expérience, réaliser cette expérience c'est choisir 
un point w€ 2, la répéter n fois, c'est choisir une suite de n points 
Ou ..., ©, dans 9. Soient À une algèbre d'événements observables dans 
une expérience, À EX. Désignons par £,(4) le nombre d'apparitions de 
l'événement À au cours de n épreuves (si w, € À, c'est que À a lieu dans la 


i-ème épreuve). La quantité »,(4) = _ k, (A) est appelée fréquence de l’événe- 


ment 4 dans # épreuves. Elle caractérise jusqu’à une certaine mesure le lien 
objectif entre les conditions de l'expérience et l'événement 4. 

A noter que v,(4) varie avec net d’une série d'épreuves à l’autre. 

Voici les propriétés fondamentales des fréquences. 

1. Si U est un événement certain, alors v,(U) = 1. 

2. Si Vest un événement impossible, alors v,(F) = 0. 

3.0< v, (4) =& 1, VAE. 

4. Si A C B, alors v,(4) = v,(B). 

5. Si À et B sont incompatibles, alors v,(4 + B) = »,(4) + »,(B). 

6. Si A,,..., 4, sont deux à deux incompatibles, alors 


v(S Ai) F5 >» vn(A);. 


LE v,(4) = 1— (4), VA € YA. 


1.2.2. Axiomes des probabilités, La stabilité des fréquences est un fait 
important établi cmpiriquement. Lorsque le nombre des épreuves croit, les 
fréquences des événements oscillent autour de certains nombres ne dépen- 
dant ni du nombre ni de la série d'épreuves et tendent vers ces nombres 
lorsque 11 -> ©. Il est naturel de rattacher ces nombres à chaque événement. 
Ces nombres sont appelés probabilités et sont définis de manière purement 
axiomatique. En théorie des probabilités, l'existence des probabilités est 
postulée et leurs propriétés définies par les axiomes des probabilités suivants. 

I. À chaque événement 4 EX est rattaché un nombre P(4) compris 
entre 0 ct 1 et appelé probabilité de À. 

II. Si À ct B sont des événements incompatibles, alors P(A + B) = 
= P(4)+ P(3). 

JT. P(U) = 1, où U est un événement certain. 

Les axiomes mentionnés sont naturels, si l’on comprend la probabilité 
comme Îa limite de la fréquence, puisqu'ils sont réalisés pour les fréquences 
(cf. propriétés 1, 3, 5). 

Ces axiomes impliquent les propriétés suivantes : 

IV. P(I) =: 0, où P’est un événement impossible. 

V. P(4) = 1 — P(4). 

VI. Si 4 C B, alors P(4) = P(B). 

VII. Si 4,, 42, ..., 4, sont des événements deux à deux incompatibles, 


alors . | 
P(S 4) - © PA. 
{=} i—1 
VIT. Pour tous À ct D 
P(A4+ B) =: P(4) + P(B)- P(ANB). 
IX. Pour tous 4,, 42, ..., 4, 


ä L 
P( 4) = © Pa 
CEA {—1 


X. Soient 4,,..., 4, des événements Arsie 


4,4, ... À,. Alors 


PLdi Aa 14) À PO) - SE PCA … 
(—1 é 


US 


AC POinu)t ee CP Pia) 
{ 


1 To <ik 


1.2.3. Définition classique de la loi de probabilité. Soit donné un système 
complet d'événements élémentaires : E;, E2, ..., E,. Chaque événement de 
9 est alors de la forme 


A=VYE, (2.1) 
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Où (sim se) est un sous-ensemble de l'ensemble (1, 2, ..., #1). Donc, 
d'après la propriété VII 


P(4) = S'P(E,) = 5 P(£): 
BC A 


Par conséquent, la probabilité attachée à une expérience finie est déterminée 
par les probabilités des événements élémentaires. 

Pour de nombreuses expériences finies, on peut établir à priori, par des 
raisons de symétrie, que des événements élémentaires possèdent la même 
probabilité. La probabilité de chaque événement élémentaire est alors égale 


à : (a étant le nombre d'événements élémentaires), et la probabilité d'un 


e LA L.] ni [4 , L4 e C1 
événement 4 de la forme (2.1) égale à Fi Les événements élémentaires qui 


ont même probabilité sont dits équiprobables. Les événements élémentaires 
impliquant À sont dits éventualités (ou cas) favorables à À. Donc, P(4) 
est égal au rapport du nombre de cas favorables au nombre de cas possibles. 

La définition classique de la probabilité implique le calcul des nombres 
de cas possibles et de cas favorables. Ce calcul sc fait à l’aide des méthodes 
de l’analyse combinatoire. 

Exemple. »# boules sont distribuées dans x cases (1 > n). Quelle 
est la probabilité qu'aucune case ne soit vide, sachant que les distributions 
sont équiprobables. 

Numérotons les cases. Soit #7, le nombre de boules contenues dans la 
case de numéro si. Pour ensemble des événements élémentaires, prenons des 
groupes de x nombres (nr, m2, ...,m,), où m, = Oct > m1, = n. Le nombre 
des événements élémentaires se définit comme suit : à chaque événement on 
associe une suite des nombres 0 ct 1 d’après la règle : 


0 . 0 I 0 . …. 0 1 CES ] 0 . 0). 
rm" 3 NA 


Cette suite comprend n- 1 unités et # zéros. À une telle suite correspond 
l'événement élémentaire (m1,, #12, ...,n,), Où m1, est le nombre de zéros 
jusqu'à la première unité, #7, le nombre de zéros compris entre la première 
ct la deuxième unité, etc. Le nombre de ces suites est visiblement égal à 
C%3%-1. Pour déterminer le nombre de cas favorables, il faut calculer le 
nombre de suites telles que »n1, := 1. Ce nombre est confondu avec celui des 
suites (15, #12, ..., m,), telles que nr, == O ct à mn, =: m1— nm, = nn —1). 
Donc, le nombre de cas favorables cst C*=!. La probabilité cherchéec cest 


Cr Gn—1)!(r—1)lm! mi(mi—1)! 


Fe Din n (a—1)!(n—n)!(m+n-—1)! “ nn)! (m+n-1)!" 


1.2.4, Probabilités géométriques. Ce sont les probabilités rattachées aux 
expériences donnant lieu à une infinité d’éventualités interprétées comme 
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le choix au hasard d’un point dans un ensemble de R*. On admet que cet 
ensemble est une figure géométrique. Un événement est : le point choisi 
appartient à unc région donnée de la figure, la probabilité de cet événement 
étant le rapport du volume (resp. de l'aire, de la longucur) de cette région 
au volume (resp. à l'aire, à la longueur) de toute la figure. 

Exemple (problème du rendez-vous). Deux personnes se fixent 
rendez-vous entre deux dates séparées par un intervalle de longueur /. 
Le premier arrivé attend pendant a = /et s'en va. Quelle est la probabilité 
de rencontre ? 

Prenons pour ensemble des événements élémentaires le carré 0 = x  /, 
0 = y < /, où x et y sont les heures d'arrivée de la première et de la 
deuxième personne. Les cas favorables sont les points tels que | x —}| < 4, 
c'est-à-dire les points du carré limité par les droites y = x —a, y = X+a. 
L'aire de cette figure est /*—(/—a)°, celle du carré /, donc la probabilité 
cherchée est 


USA 


p=l- 


1.3, Définition d'un espace probabilisé 


1.3.1. Tribu d'événements. Dans les expériences où l'algèbre des événements 

cest infinie il faut considérer des suites infinies d'événements ct les opéra- 

tions sur eux. Les plus simples de ces opérations sont l'union et l'inter- 

section d'une suite infinie d'événements. Si une algèbre d'événements 

cst telle qu'avec toute suite infinie d'événements 4, elle contient également 

les événements (7 44, LU) 4,4, on dit que c'est une tribu. L'événement (7) 4, 
£ & £ 


consiste en la réalisation simultanée de tous les événements 4,, l'événement 
U A, en la réalisation d'au moins un (ou plus) événement de la suite 4.. 
& 


Une suite 4, est dite monotonc décroissante si 4, 2 4,,,, monotone 
croissante si 44 € A2, pour tous les 4. L'événement (9 4, est appelé 
: 


limite de la suite décroissante, l'événement ([J 4, limite de la suite crois- 
4 


sante d'événements. La limite d’une suite monotone (c'est-à-dire monotone 
croissante ou décroissante) 4, est notée lim 4,. 

Une algèbre d'événements X est une tribu si elle contient toute suite 
monotone avec sa limite. 

On admet que toute probabilité définie sur une tribu satisfait encore 
un axiome généralisant l’axiome II du numéro 1.2.2. dit axiome compict 
des probabilités totales (ou propriété de s-additivité) : 

IT’. Pour toute suite d'événements deux à deux incompatibles, on a 


P(U 4) = 2 P(A,). 
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Cet axiome équivaut à l’axiome de continuité suivant : pour toute suite 


monotone 4,, on a 
P(lim 4,) = lim P(4,). 


1.3.2. Espace probabilisé. On appelle espace probabilisé le triplet (9, A, P), 
où {2 est un espace d'événements élémentaires, A une tribu de parties 
de £2, P(4) une mesure, appelée probabilité, définie pour À E{ et telle 
que P(9) = 1. 

On appelle mesure sur une tribu de parties À une fonction d'ensemble 
P(4A), positive a-additive, c'est-à-dire une fonction telle que 


PU 4) = SPC) 


pour toute suite d'ensembles 4, € A deux à deux disjoints. 

Si P(Q) = 1, la mesure est normée. 

On appelle espace mesurable (ou probabilisable) le couple (f2, {) 
constitué par un ensemble {2 et une tribu A de parties de 2. Donc, un 
espace probabilisé est un espace mesurable muni d’une mesure normée. 

Si {2 contient un nombre au plus dénombrable d'éléments et JA est 
l'ensemble de toutes les parties de 4, la probabilité est entièrement définie 
par ses valeurs sur les événements élémentaires. Soient 9 = {w,, wz2, ...}, 
P({o,)) = r:, {wi} est l'ensemble réduit au seul point «.. 

Alors > 
| pour «€ 
P(4) = Dixon), où  x4(o) D pour oct 


c'est-à-dire 7,(w)est l'indicateur de l'événement 4. Les espaces probabilisés 
de ce type sont dits discrets. 

Un exemple d'espace probabilisé important est l'espace pour lequel 
{2 est l'espace cuclidien R". Un tel espace d'événements élémentaires est 
à envisager dans les expériences où l’on observe les valeurs de "1 variables 
réelles. Appelons (x!, x?, ...,x") les coordonnées du point £#E€ R®. 
Pour %, prenons la tribu des ensembles de points de la forme 


{G:a<x <b,...,a, = x" = b,,}, (3.1) 


OÙ — co << 0, < b, <= + sont des réels. De tels ensembles sont appelés 
parallélépipèdes semi-ouverts à droite. Les unions finies des parallélépipèdes 
semi-ouverts à droite forment une algèbre 9, dans R". La plus petite 
tribu %, contenant {,, est confondue avec la plus petite tribu des ensembles 
renfermant tous les ensembles ouverts et fermés de R”. Cette tribu est 
appclée tribu borélienne et les ensembles de 9 des boréliens. 

Tout ensemble de A s'obtient par un passage à la limite appliqué un 
nombre de fois au plus dénombrable à des ensembles de %,. Donc, pour 
définir une probabilité sur A (compte tenu de l’axiome de continuité) 
il suffit de le faire sur %,. Cependant, les ensembles de A, étant représen- 
tables par une somme de parallélépipèdes semi-ouverts deux à deux dis- 
joints, il suffit de définir la mesure sur des ensembles de la forme (3.1). 
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1.3,3. Fonctions de répartition, Soit 
G(b,, ..., ie Se (3.2) 
Désignons par RUE er) EL CE SE LAS LE a ee 
— G(x!, ..., À OS de) l'accroissement de la fonction 
G(x!, ...,x m) par Poe à x sur l'intervalle [a, b[. On a alors 


PK :a=xt<b,,...,a, <= x" < b,}) = 


= AU NT Am Gt. x). (3.3) 


CET On CPE 

Donc, toute mesure sur un espace mesurable (R”, A) est définie de 
façon unique par une fonction G(x', ..., x") de la forme (3.2). Pour que 
cette mesure soit normée, il faut et il suffit que 

I. lim Gx!, ...,x") = 1. 

al» w,,...,28 D 00 

Indiquons encore quelques conditions que doit nécessairement satis- 

faire G. L'axiome de continuité implique que 


Il. : lim G(x!,...,x") = 0  pourtousles k=1,...,m. 
JL. Jim G(x!,..., x) = G(b,, ..., b,) 
s1106,,...,4m00, 

quels que soient b,, ..., b., c'est-à-dire la fonction G(x', ..., x") est 
continue dans son ensemble à gauche. 

De (3.3) il s'ensuit que 

IV. M Roger A AOC 20e 7) 25 0 

La fonction G(x!,...,x") qui vérifie les conditions I à 1V est dite 
fonction de répartition de dimension m. Pour m = 1 ces conditions se 
réduisent à ceci : on appelle fonction de répartition de dimension un une 
fonction F(x) continue à gauche, croissante, définie sur R!' et telle que 

lim F(x) = 0, lim F(x) = 1. 
Z- Z + 

A toute fonction de répartition de dimension 17 est asssociéc une 

mesure probabiliste unique sur (R", ‘L). 


1.4, Variables aléatoires 


1.4.1. Définition d’une variable aléatoire. Les variables aléatoires sont les 
variables mesurées dans les expériences aléatoires. Une variable aléatoire 
est entièrement définie par une éventualité w. Donc, une variable aléatoire 
£ sur un espace probabilisé (2, A, P) décrivant une expérience aléatoire, 
est une fonction d'événement élémentaire £(w). Si l’on peut mesurer cette 
variable, c'est que l’on peut observer l'événement suivant : la valeur de 
€ appartient à un intervalle donné 4 quel que soit À. 
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Donc, 
{o : E()E A}E A. (4.1) 


Les fonctions &(w) vérifiant la condition (4.1) pour tous les intervalles 
4 sont dites mesurables relativement à la tribu {A ou Â-mesurables. 

On appelle variable aléatoire sur un espace probabilisé ({2, A, P) 
toute fonction U-mesurable £(w), définie sur 2. On omet souvent d'indi- 
quer la dépendance de la varible aléatoire par rapport à w et l'on écrit 
& au lieu de é(w). 

Un exemple élémentaire de variable aléatoire est l'indicateur 7 ,(w) 
de l'événement À : 

1 si wEA; . 


ro = {0 44 


Un autre exemple de variable aléatoire est une variable aléatoire 
discrète prenant un nombre au plus dénombrable de valeurs distinctes. 
Supposons que ce sont les valeurs {x,, x2, ...}. Les événements {£(w) — 
= x;} = À, sont visiblement deux à deux disjoints et [ J 4, = 9. Supposons 

( 


que 
P(4,) = P{E(@) = xs} = P{E = x} = mr. 


L'ensemble des probabilités {p,} et des nombres {x;} est appelé répartition 
ou loi de probabilité de la variable discrète &. Elle définit la probabilité 
que la variable £ appartienne à un ensemble quelconque À de la droite : 


z! € A 
1.4.2. Loi de probabilité d’une variable aléatoire, On appelle loi de proba- 
bilité ou répartition d'une variable aléatoire £ la mesure 
PA) = P{o : E() € A}, (4.2) 
définie sur la tribu des boréliens de R'. De (4.1), il s'ensuit que pour tous 
les boréliens /1 
{o : E(w) € A}E A, 


donc le second membre de (4.2) est défini. 
D'après les résultats du numéro 1.3, pour définir la loi de la variable &, 
il suffit de se donner la fonction 


Fa(x) = Pe(]- co, x[) = P{Ë = x}, 


que l’on appelle fonction de répartition de la varlable £. Cette fonction de 
répartition est de dimension un. 
Si & est une variable discrète pour laquelle P{È = x,} = r,, alors 


FAX) = = Y'pE(x-x,), 
(x) 2, à PE vs) 
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où e(x) = 1 si x > O0 et e(x) = 0 si x = 0. Désignons par Fe (x +0) la 
limite à droite de la fonction F:(x) au point x. Le saut de la fonction de 
répartition F:(v+0)— F:(x) a la même valeur que la probabilité P{£ — x}. 
On dit que £ suit une loi de probabilité continue si F:(x) est une fonction 
continue. Dans ce cas la probabilité que £ prenne une valeur fixe quelconque 
est nulle. La variable £ admet une loi de probabilité absolument continue 
si existe une fonction /:(x) telle que 


Fax) = [ faU) dt. (4.3) 


. La fonction f(x), qui vérifie la relation (4.3), s'appelle densité de 
probabilité de la variable £. Si fe est la densité de probabilité de £, la loi de 
£ est donnée par la formule 


PA) = [ JG) dt (4.4) 
A 
(l'intégrale de (4.4) est de Lebesgue). En particulier, 
ô 
P((Qa, b)) = [ eG) dt = Fi(b)— Fa). 

La densité de probabilité satisfait les deux conditions suivantes : 

a) far) > 0 pour presque tous les f ; 

b) fAGd= [fo dt = 1. 

Toute fonction 2Q mesurable-Lebesgue, vérifiant les conditions 
a) et b), peut être densité d’une certaine variable aléatoire. Voici quelques 
exemples de densités de probabilité. 

Exemple 1. La densité d'une variable £, uniformément répartie 
sur [a, b] 


0, xXY<a 


Sax) = =: a=<x<b; 


O0, X > b. 
Excmple 2. La densité de la loi exponenticlle 
0, x <0; 


feG) = Je, x = 0. 
Exemple 3. La densité de la loi normale 


FO 


4/27xb 


Unc variable £ suit une loi réticulée (ou est réticuléce) si elle est discrète 

et les valeurs qu'elle est susceptible de prendre sont de la forme a+Kkh, 

= 0, +1,... La quantité A est appelée pas de la loi. Il existe 4 maximal 
tel que pour un a 


D P{È = a+kh} = 1, 


si sculement & prend au moins deux valeurs avec une probabilité positive. 
h est appelé pas maximal de la loi. Si £ prend les valeurs a+ Kh, alors À = dh, 
où d'est le p.g.d.c. des différences k, — k:, pour lesquelles P{È = a+k,h} > 0 
et P{È = a+k.h} > 0. Parmi les variables réticulées signalons une impor- 
tante classe de variables à valeurs entières, pour lesquelles 


m5 P{ = k}= 1. 


Exhibons quelques exemples. Posons p, = P{É = k}. 
Exemple 4. Une variable £ a une loi binomiale si pour un 
a€ ]0, 1[,n > 0, 


m=0 k<O0; m=Ct'a(l-a), k<n; m=0, k>n. 


Exemple 5. Une variable £ admet une loi géométrique si pour 
un a€ ]0, 1[{ 


Pre =0, k<0; pe = (i-a), k>0. 


Exemple 6. Une variable £ admet une loi de Poisson si pour 
una > 0 ie 


Pl = 0, k=<O;:; PR pe k = 0. 


1.5. Groupes de variables aléatoires 


1.5.1. Loi conjointe de variables aléatoires. Soient données »7 variables 
aléatoirs £,(w), ..., £.(w) sur un espace probabilisé ({, A, P). Alors pour 
tous les a, = b,,...,4, <= D, 


{o : a, = E(o) < b,, ...,a, = Ë,(@) < b,,} = 
7 N {o : a = bo) < b,}E A. (5.1) 
CS 


Désignons par (£.(w), ..., ë,(w)) le point de R”" de coordonnées 
E,(w), et par :1 un parallélépipède semi-ouvert dans R* : 
A={x:a<x'<b,,...,a, = x" < b,). 
La relation (5.1) peut encore s'écrire : 


{o :(E(), …, Ex(w)) € À} €. (5.2) 
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De (5.1) ct des égalités 
( {co :(£io), .…, En (@)) € B,} {o : (£(o) ..…., L()) € ( 5} ; 


ÿ {on : (Elo), ..., E(@)) € B;} = {o : (E(w), ..., &,(@)) € U Bi}. 


valables pour toute suite d’ensembles de R" il s'ensuit que (5.2) est valable 
si 4 est un borélien de R”. 
La mesure y, ...,.. définie sur les boréliens de R” par 


le... 8,8) = P({o: (Ho), ..., E,(@))E B}), (5.3) 


s'appelle répartition conjointe des variables &,, ..., £, ou encore du vec- 


teur aléatoire Ë :- (£,(&), ..…, &(@)) de R*. Comme indiqué dans le n° 1.3, 
pour se donner la mesure y, 4. il suffit de se donner la fonction 


PR Cr es Xn) P{o :E,(@) = x, ..., £ (@) < Xn} = 
7e Pi, = No es <= Xn} (5.4) 


appelée fonction de répartition conjointe des variables £,,.. ,£,. Cette 
fonction est fonction de répartition de dimension »#, donc elle vérifie les 
conditions I à IV. Sachant la fonction de répartition conjointe des variables 
rc Es ON peut définir celle des variables &,, ...,£,, où O0 < i, < ... 
. 1 mm 
.<h<Em: 


1 Li bo 


(5.5) 


de 8 Ces es Na) io Fa, es CV 7" Xm) Jr, ..., 8 


(var FCI) on comprend lim F(), La relation (5.5) découle 


> 4 


immédiatement de (5.4), puisque {£, — + } est un événement certain. Les 
fonctions de répartition conjointes d’un sous-ensemble de variables aléa- 
toires, déduites à partir de la fonction de répartition de l'ensemble tout 
cnticr de ces variables, s'appellent fonctions marginales (partielles) de 
répartition (la formule (5.5) définit les fonctions de répartition marginales 


de dimension #). En particulier, sachant Fe. 8, on peut déterminer les 
fonctions de répartition des variables &, : 
& 
À, 
Fe, (x) — Fe, CT ©, ..., + ©, AT À: OO, ..., + co). 


1.5.2. Lois discrètes et continues. Si chaque variable £, a une loi discrète, 
on dit que le vecteur aléatoire (QT ….., %) à aussi une loi discrète (ou 
que la loi conjointe des variables £,, ..., &, est discrète). Supposons que 
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&, prend les valeurs {y#, y, ...}. La loi conjointe des variables &,, ...,&,, 
est alors définie par 


Pa, cm E P{é 2 »i ê Es LR Ha Êm — Y} 
La mesure définissant la loi conjointe de &,, ..., £, est donnée par l'éga- 
lité 
1 EPRSRR 8, (B) = D Pi, RAT OR Ye) 
où 


. ( [ ") - I si G!, .,}")€eB; 
rt To si G1...,»6€8, 


G!,..., y”) étant un point de R* de coordonnées y‘. L'expression de la 
fonction de répartition conjointe est 


FES eZ Panne 


mn 
vi, < Lo ..., Vi mn 


La loi multinomiale de dimension m est un exemple de loi discrète 
de dimension 1. Les variables £, sont entières, et, de plus, pour certains 
m 


næ=0i=1,...,m, ÿ n =1ona 
{=i 


PÉi=in. En = in} = 
n! { { . ’ 
A A LÉ Pr,  h>0;:k=1,...miut... +R =; 
= 1° n° 
(4) dans les autres cas. 

Les variables £,, ..., £, suivent une loi conjointe absolument conti- 
nue si existe une fonction mesurable-Lebesgue fe,...,8 (Xi: X) 
telle que la loi conjointe des variables £,, ..., &, soit définie par 


de CB) = [fee (tr x) dx. dx 
: 


(à droite on a une m-uple intégrale de Lebesgue). La fonction 
Ja, EC ce Xn) 6St alors appelée densité de répartition conjointe des 


variables £&,, ...,&.. La fonction de répartition conjointe s'exprime au 
moyen de la densité conjointe par 


"ñ 


Fee (Xi ce Xe) = f sa La Or A LEUR 


De cette relation on déduit la formule suivante pour la densité : 
F6 Led 
Je, Ar ... Xh) = Ox1 ... ds, Fe, A (a: 9 Xn)° 
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A noter que l'existence pour tous les x,, ...,.v,, de la dérivée du second 
membre n'assure pas encore l'existence de la densité. Pour que la densité 
existe, il est nécessaire ct suffisant que 


oO œ 


0" 
( … Î x... Où, Fa. (Cr see Xn) 4X; du S dx, le 


Les deux propriétés suivantes de la densité conjointe sont évidentes : 
a) fee (Ni. X,) > 0 pour presque tous Îles x,, ...,x, ; 


LS 


b) (| pu re Gr ces Ve) Xi ce XL. 


Toute fonction g(x;, ...,x,) mesurable-Lebesguc vérifiant les con- 
ditions a) et b) peut être densité conjointe de »7 variables aléatoires. On 
l'appelle densité de dimension »11. 

Une intégration de la densité par rapport à un argument x,, 
J#Æix..., à entre —o et + nous donne la densité conjointe des 
variables CPR Frs CPR En particulier, 


Co 


SO = Î .. f La ee en 


Xe + ls Xm) dx, ... dx | dx +1 °°: dx 


Citons deux exemples importants de densités de dimension m. 

Exemple 1. Un vecteur aléatoire (£,, ..., ë.) est uniformément 
réparti sur un ensemble mesurable borné G € R" si la densité conjointe 
des variables &,, ..., &, est de la forme 


[| 
fa ne (rs x) = { Mes G” 
0 » (1 …..s Na) 4 G, 
où mes G est la mesure de Lebesguc de G dans R°®. 
Exemple 2. Un vecteur aléatoire (£,, ..., &,.) a une loi normale 
non dégénérée si existent des nombres a,, ..., a, et une matrice définie 


positive symétrique non dégénérée C = ||C,;1l, tels que la densité con- 
jointe des variables &,, ..., &, soit de la forme 


(Cr. X)EG ; 


fa ee x) = @7) À fdet CJM exp { > Cytxi— a) ca} 


1.5.3. Fonctions de variables aléatoires. Si l’on connaît la loi conjointe 
des variables £,, ...,£,, on peut déterminer la fonction de répartition 
d'une fonction de ces variables : g(é,,...,£,), où g(x:, ..., Xn) est 
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unc fonction borélienne définie sur R", c'est-à-dire une fonction mesurable 
relativement à la tribu des boréliens de R”. Soit = g(£,, ..., £.), alors 


FO) = P{p<x)}= [ff ne. ea (x), 
etat, ...,2")<z 
(où # = (x!,...,x") est la variable d'intégration sur R" ; l'intégrale, 
qui est une intégrale de Lebesgue par rapport à la mesure He. St 


étendue au domaine {# : g(x', ..., x”) < x} qui est un borélien de R"). 
Soient g(x,, ..., x.) une fonction dérivable ct 


7 7 3 
Igrad gx, ..., x..)| = D Ê (Es (Lies a) > 0 


Si les variables &,, ...,&, admettent une densité conjointe, la variable 
7 admet aussi une densité définie par 
m—]1 
LUS …. | Jr 2. Xn) Igrad gr, ..., Xl ? 


] TE 


où l'intégrale du second membre est une intégrale de surface étendue . 
une surface de R" de dimension (#7— 1), d'équation gx,, ..., x) = 

Soient gx, ..., Ne), RaN ue ces Nm) ce BAND e X _) des ne. 
tions boréliennes définies sur R". Posons 7, = g{(£1, ..., ET La loi con- 
jointe des variables 7,, ..., 7, est alors définie par 

Hu mO = f...f le, e (4%) 
(outzt, ..., 28), ..., ggtate ..., zh) € © 

pour le borélien C © R°; l'intégrale du second membre est étendue à 
l'ensemble {X : £(F) € C}, où g = (gr, ..., gr) sont les points de R* de 
coordonnées g1, ..., gi. 

Supposons que les fonctions g:, ..., g,(k << m) sont dérivables et 
existe la densité conjointe des variables &,, ...,£,. La densité conjointe 
des variables 7,, ..., 7, s'exprime alors au moyen de la formule 


m—k 


i mOn Jr) = [| EPA CT sn) X 


CEST ..…... LT n) = 


CN CPRREETE AA LIT" 


dS x 


| ) | D(gi ..., 82) ‘. 
ner << LO(Rs  Xa) 
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L'intégrale du second membre est une intégrale étendue à une surface de 
dimension »1—k, définie par le système d'équations : gi(xs, ..., X) = 
= Jpioce LAN ces No) = Je €t 


Dei 
Ox,, Ôx, 


Ogr Ogx 
Ox, 0x, 


est le jacobien des fonctions g,,...,g, par rapport aux variables 


Xi . [] Vi, 


Considérons les lois de fonctions simples de deux variables aléatoires. 
Loi de la somme (resp. différence) de deux variables. La fonction de 
répartition de la somme (resp. différence) est 


Fe se (N) = ff le, CAS dx°). 


ON , a'iri<s 
Si existent Ja, &» alors 
Jess = [ler ») dr. 


Si &, ct &, sont des variables entières discrètes, p,, = P{£, — &k, E: = j}, 
alors 


P{£ités = 1} — ; y Pis: 
Loi du produit de deux variables. La fonction de répartition du pro- 


duit est donnée par 
Fee (x) = I] (| [CTP CA dx). 


z'a<2 


Si existe Je. ëe alors 


> 


neo [rule #) 


— 


Loi du rapport de deux variables. La fonction de répartition a pour 


expression 
Fee, C9 = Î He. e(dx", dx?). 
Yai<zx 
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Si existe Je le alors 


far) | re x 


1.6. Espérance mathématique 


1.6.1, Espérance mathématique d’une variable discrète. Supposons qu'on 
observe une variable aléatoire £, pouvant prendre un nombre fini de 
valeurs u,,...,u, avec les probabilités p;,, ..., px. Six, ...,x, sont 
les observations de la variable £ dans # épreuves successives de l'expérience, 
la valeur moyenne des quantités observées peut se mettre sous la forme 


I n 
= (vs t Nat Ses +x,) a Y dv, (42), 
CL ki 


où 4, est l'événement {5 == «}, », sa fréquence. En remplaçant les fré- 
quences par les probabilités, on obtient l'expression 


Y 
Eÿ = y Gs las 
Az 


appcléc moyenne ou espérance mathématique de la variable £. 
Si £ cest une variable aléatoire discrète, prenant les valeurs @, 
k == 1,2, ..., avec les probabilités p,, l'expression 


La 


Li — ÿ QG Px 
CE 


cst appcléc espérance mathématique de À, si seulement la série de droite 
converge absolument. Voici quelques propriétés de l'espérance mathéma- 
tique d’une variable aléatoire discrète. 

I. L'existence de E£, ct EË, entraine celle de E(Ë,+£,) = EË, + EË.. 

II. E(48) — ÀEË pour tout À, si seulement Ef existe. 

HT. Si P{é, = &;} =: 1, alors, Eë, = E£, (si les espérances mathéma- 
tiques existent). 

IV. E£ => 0, si à _- 0 et EË existe. 

V. Si P{È = c} = 1, alors Ef = c. 


1.6.2. Espérance mathématique d’une variable. Pour déterminer l'espérance 
mathématique d’une variable aléatoire quelconque £, on considère la 


suite des variables aléatoires discrètes £&,, définies par &, = £ si £ & 
= E < +, k = 0, +1, +2,...; n =1,2,.... De toute évidence, 
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| L 1 LA LA [1 
lé, —êt < FE Si E£, existe pour un n, elle existe pour tous les # et existe 
la limite 

: | A à k k+1 
lim Et, = lim 5 P{+ æË < 2 . 
n 


n —+ oo A — 00 Em nl n 
Cette limite s'appelle espérance mathématique de la variable £ et se note 
Eë. L'espérance mathématique ainsi définie possède encore les propriétés 
I à V. Si £ est une variable aléatoire positive, on convient que EË£ est toujours 
définie et égale à + dans le cas où la série D p{t < Ë <— 4 
£n0 
diverge. 


1.6.3. Formules pour le calcul de l’espérance mathématique. 
Si F:(x) est la fonction de répartition de la variable &, alors 


ES = f x dF;(x) pour (] x! dFe(x) < 


— © — œ 


(les intégrales de droite sont des intégrales de Stieltjes et se calculent comme 
des limites de sommes intégrales). Si existe la densité /:(x) de la variable &, 
alors 


Ca] FN] 


Ef = f Xfa(x) dx pour f [x 1 f(x) dx < co. 
Si la variable £ = E(w) est définie sur un espace probabilisé (9, %, P), 
son espérance mathématique peut être calculée à l’aide de l'intégrale de 
Lebesguc par rapport à la mesure P : 
Ef(w) = | £(w) P(dw), 
sous réserve que l'intégrale de droite existe. 
Soient &,,£,, ...,&, des variables aléatoires, Fe... 8 (Nas - + Xe) 


leur fonction de répartition conjointe, g(x,, ...,\.,.) une fonction borélienne. 
Alors 


Es...) = ff... Pers x) de eu ce 4) 
si seulement l'intégrale de droite converge absolument (cette intégrale 
est une intégrale mn-uple de Lebesgue-Sticltjes) ; si g est une fonction con- 


tinue, on a affaire à une intégrale de Riemann-Stieltjes. Si la densité con- 
jointe des variables &,, ..., £, existe, la formule précédente devient 


Eg(é,, ...,6,) = ff... fe(rr x) fe (ti ce x) dti. dx, 


pourvu que l'intégrale m-uple de Lebesgue du second membre converge 
absolument. 
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1.6.4, Moments des variables aléatoires. La quantité 
Et = [xt dF(x), k = 1,2, ... 


est appelée moment d’ordre & de la variable & (si existe l'espérance mathéma- 
tique indiquée). Le moment d'ordre 4 de la variable £ — Eë s'appelle moment 
centré d'ordre &. On le calcule avec la formule 
EG Et} = f(x Et) dF{x). 

On appelle moment absolu d'ordre & de la variable & le moment d'ordre k 
de |ËI. 

Le moment centré d'ordre 2 joue un rôle particulier. On l'appelle 
variance de & et on le note Var é : 


Var £ — E(t-Eë)? = Ei’-(Ef)t = 
= [GE F6) = [xt dFe(x)-([ x di). 
Pour les variables aléatoires absolument continues, la variance se 
calcule par la formule : 


Var & = [(x—E8)t fat dx = | x%f00 dx —(f xfeG) dx)”. 


Pour une variable discrète £ prenant les valeurs à, avec les probabilités 


Pa On a ; 
Var ë = L aÎPi— D ani) . 


On remarquera que Var £ est toujours définie si EË l'est, mais elle 
peut prendre la valeur + co. 


La quantité ao = 4/Var £ s'appelle écart type de Ë. 

Signalons encore une propriété importante de Var ë ; si Varë = 0, 
alors P{f = E£} = 1, c'est-à-dire la variable £ est presque sûrement cons- 
tante. 

Soient £,,...,£, des variables aléatoires données de fonction de 
répartition conjointe F., EE ea ss Nu). Les quantités 


do ose (Ar ... k,,) — 
= Î … fx … ee dFe (Xi ire Xn) = E! nn Em, 


où £n...,k, = 0,Kk1+ ... +4k, = Kk, sont appelées moments mixtes 
d'ordre # des variables &£,, ..., £.. Les moments mixtes d'ordre 2 jouent 
un rôle particulier parmi les moments mixtes. La quantité 


E($ — Eë) (7 - Er) 
est appelée covariance des variables £ et 7 et notée cov (é, 7). La quantité 
cov (Ë, n) 


r a —_— 
si 4/Var & Var 7 
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est appelée coefficient de corrélation des variables £ et 7. Indiquons quelques 
propriétés du coefficient de corrélation 

1 —1 & ren S 1. 

2. Silre | = 1, on a presque sûrement 


Var 
7 ren) RTE -ED+ En 


(c'est-à-dire £ et » sont liées par une relation linéaire). Donc, r:, peut 
ètre considéré comme la mesure de la dépendance linéaire de Ë et ». Si 
& et y sont telles que rs, -: 0, on dit qu'elles sont non corrélées. 

Soient £,,...,£, des variables deux à deux non corrélées. Alors 


L.] L 
Var Ÿ &- ÿ Var£&. 
EL &-t 
Si £, ..., &, sont des variables aléatoires telles que Et? <c, i = 
= 1,...,m, alors la matrice R = |1b,ll, 3.1... où b, = cov(£, à), 
s'appelle matrice des covariances (ou de corrélation) de &,, ...,£, (du 
vecteur (£,, ..., &,)). La matrice de corrélation est définie positive, c'est-à- 
dire pour tous nombres complexes «&;, ...,4,. on a 
LD 
Y biyaä,=- 0, 
NES 
où & est le conjugué complexe de «. 
Calculons l'espérance mathématique et la variance de quelques 
variables aléatoires ayant des lois discrètes et absolument continues. 
a) & est une variable à valeurs entières répartie selon une loi uniforme 


sur [O,N]: P{È - 4} — x - pour &£ —- 0,1, ...,N, 


. 2 L N. 

n N+I 2” 
LS 1 N\° NN 
E — PRE EN De _ AT 
Lo 2e N+1 o) 126? 


b) & a une loi binomiale : P{É -: k} — Céat(t— a), k — 0,1, ...,N ; 
0O<a<t, 


Y 
ES — Ÿ ACSa(l— a)" ! - Na; 
4-0 
N 
Var£ = SACS a)" ENS = Nail — a) ; 
&-0 
c) £ a une loi géométrique : P{È — &k} -: (1— ae, K — 0,1, ...; 
0<a<îl 


ao. 
1-4 


FES D AG -o - 
1-0 
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Se. Cfa Yi at à __at&., 
Varë= }, k{ a)é (52) (= (-aÿ (1 aÿ? 


d) £ a une loi de Poisson : PE= = Tes, k=0,1,2,...; 


a > 0. 


Ef= SE = 4 ; 
&=0 
Va sim, pie di #4 


+ ” KE) Le =: 


e) £ a une loi uniforme sur [a, b] : 


(ET (5 
Y— ( 2 = 12 ; 
f) £ a une loi exponentielle : fz(x) — 2e 47, x > 0, fe(x) = 0, x & 0, 


Le) 


E£ — LL xe”k dx = 


<< 
Fe) 
an | 
f 
| 
| 
— 
% 


Le 
A 


Î —_ 
V/2nb 


e (se) 
1 à 
Var Ê = ——— x—aÿe % dx= 
4/2xb l d 
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1.7. Probabilités conditionnelles ct espérances mathématiques 


1.7.1. Probabilité conditionnelle par rapport à un événement. On appelle 
probabilité conditionnelle d'un événement À par rapport à un événement B 
(ou sachant B) tel que P(B) = 0, l'expression 


B 
P(4/B) = ÉD 


De cette formule on déduit la formule du produit des probabilités : 
P(ANB) = P(4/B) P(B) = P(B/4) P(4) 
et l'expression de P(4/B) en fonction de P(B/4) : 


P(B/A) P(4) 
P(3) 


Indiquons également la formule générale du produit des probabilités : 
n n-1 
r(N 4) = P(4,) P(A./4A,) e(4/ N ms). 
El k= 


Formule des probabilités totales. Soit E,,...,E, un système complet 
d'événements. Pour tout événement 4 on a alors 


P(4/B) — 


P(4) = 2 P(4/E,) P(E)). 
&E.. 


La formule de Bayes donne l'expression des probabilités conditionnelles 
d’un événement FE; du système complet par rapport à un événement À : 


P(4/E) PE) 
À, P(/E) P(E) 


P(E/4A) = 


Cette formule est appelée aussi formule des probabilités des causes. Sup- 
posons que l'événement 4 sc réalise sous la condition }, qui consiste en 
ce que l'événement E, a lieu avec la probabilité P(A/E,) et que P(E,;) est 
la probabilité de la condition /7,. La formule de Bayes nous permet de 
calculer la probabilité de la condition A, par rapport à l'événement 4 
en fonction des probabilités de 4, et des probabilités de À pour diverses A. 

Exemple. On considère » urnes contenant chacune des boules 
noires et blanches. La probabilité de tirer une boule noire de la £-ième 


. 0 
urne est égale à p,. On choisit une urne au hasard (avec la probabilité s) 


puis on en tire une boule. Quelle est la probabilité que l’urne choisie soit 
la &-ième si la boule tirée est noire ? 
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Si F, est l'événement qui consiste en ce que l'urne choisie est la £-ième 
et À, en ce que la boule est noire, alors 
P(E,/A) = ——P: 


Pat - +Pn 


1.7.2. Loi conditionnelle d’une variable aléatoire. Soit une variable aléatoire 
£. L'expression 
P({£ = x}N4) 

P(4) 
s'appelle fonction de répartition conditionnelle de la variable £ par rap- 
port à l'événement 4. Elle est définie si P(A4) — 0. Si F:(x/1) est absolument 
continue et 


Fa(x/4) 


F:(x/A) = ( fa(/A) dt, 


la fonction /&(x/1A) s'appelle densité conditionnelle de la variable £ par 
rapport à l'événement 4. La fonction de répartition conditionnelle et la 
densité conditionnelle possèdent les propriétés de la fonction de répartition 
et de la densité respectivement. Les moments calculés par rapport à une 
fonction de répartition sont appelés moments conditionnels de la variable £. 
En particulier, l'expression 


E(£/4) = [ x dFa(x/A) 


sous réserve que l'intégrale de droite converge, s'appelle espérance mathé- 
matique conditionnelle de la variable £ par rapport à l’événement 4. Si 
ë est définie sur l'espace probabilisé (9, A, P), l'espérance mathématique 
conditionnelle s'écrit : 


E(#/A) = Sci J ét) Po). 
n. | 


Soit E;,...,E, un système complet d'événements. On a la formule de 
l'espérance mathématique totale 


Et - > E(é/E,) P(E). 


On peut exhiber une formule plus générale. En effet, si C = UE,,. alors 
(| E(w) P(dw) = ÿ° E(#/Es) P(E). (7.1) 
QC LAS CC 


Supposons que À = {a = Ë < b}. La fonction de répartition conditionnelle 
0, N<a; 

Fa(x) — Fe(a) 

F:(b) — Fa(a) ” 
I, x > b 


Fe(x/a) = £ < b) = a=x<pb; 


29 


définit alors la loi de la variable tronquée £, ou loi tronquée. L'espérance 
mathémaique et la variance d’une loi tronquée s'écrivent : 


E(£ | {a = E < b}) = x dFa(x) ; 


noirs) 
Fe) — Fe(a) 


Var (£| {a = £ < b)}) — x? dFa(x) — 


noix) 
Feb) — Fa(a) 


b 2 
i 
_ (arc 5-FG Î rar) : 


1.7.3. Probabilité et espérance mathématique conditionnelles par rapport 
à une tribu. Si E;, ...,E, est un système complet d'événements, l’ensemble 
des réunions UE, et l’ensemble vide @ forment la plus petite tribu conte- 
nant les ensembles Æ,. Désignons-la par %,. Supposons que EË£ existe. 
La variable aléatoire, égale à E{£/E,) sur E;, s'appelle espérance mathéma- 
tique conditionnelle de la variable £ par rapport à la tribu %,. On la désigne 
par E(£/M,). Elle vérifie les deux conditions suivantes : 

I. E(£/,) est %.-mesurable. 

II. Pour tout CEA, 


Ÿ £(&) P(uw) = [ EN) P(dw). 
© 
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La première condition dit que E(£/Ï.,) est constante sur les ensembles EF, 
ce qui résulte de la définition. La deuxième découle de (7.1). 

Une variable n est {,-mesurable, %, étant une tribu d'événements de 
9%, si pour tout intervalle 4 


{o : mow)E 4}EU. 


Une variable aléatoire 1 est dite espérance mathématique conditionnelle de 
£ par rapport à la tribu #, € Y, si 

1) n est %.-mesurable ; 

2) pour tous les CEA 


J E&) P(dw) = [ mo) P(do). 
© 0 


On remarquera que les conditions 1) et 2) définissent presque sûrement de 
façon unique la quantité 7(w). Si 7,(w) satisfait également les conditions 
1) et 2), alors 


[ Into) mo) Po) = [ (mo) -1(@)) PAdo)+ 


{m-_n>0) 
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+ f (Go) — 7 (o)) P(do) — f (EC) — E(o)) P(do) + 
{1m > 0} {m-1> 0) 
+  f  (£w)-E(&)) P(dw) = 0, 


{n-m>0) 


puisque {7-7 > 0}, {7-1 > 0}E A, par suite de la %,-mesurabilité 
de 7-11. On désigne par E{£/%,) l'espérance mathématique condition- 
nelle de la variable £ par rapport à la tribu %,. Elle existe toujours si 
ES] < co. 

L'expression P(4/)) :: Exa(o)/M), où ao) est l'indicateur de 
Rs A, s'appelle probabilité conditionnelle de Æ# par rapport à la 
tribu %,. 

On dira qu'une tribu %{ est dénombrablement engendrée si existe une 
algèbre %’ contenant au plus un nombre dénombrable d'ensembles et 
telle que ! soit la plus petite tribu contenant A’. La probabilité condition- 
nelle n'étant définie que presque sûrement, la probabilité P(4/Y.) peut 
varier sur un ensemble P-négligeable, Si A est dénombrablement engendrée, 
on peut définir P(4/Ï,) de telle sorte que P(A/1,) soit mesure probabiliste 
par rapport à À pour presque tous les w. Ceci étant, les espérances mathéma- 
tiques conditionnelles sont données par 


E(£AQ) = [ £(w) P(dw/\lo). 


L'expression F4x/o) = P({w : £(w) < x}/X,) s'appelle fonction 
de répartition conditionnelle de la variable £ par rapport à la tribu Y, ; 


si Fe(x/Mo) = f JG) dt, alors fe(x/) est dite densité conditionnelle 
de la variable £ par rapport à la tribu \,. 


1.7.4, Propriétés des probabilités et des espérances mathématiques condi- 
tionnelles. 
a) Formule de l'espérance mathématique totale 


ES = EE(Ë/Y(0). 
b) Formule des probabilités totales: 
P(4) :: EP(4/o). 
c) Mise en facteur : si 7 est une variable %,.-mesurable, alors 
Eén/o) = EE No). 


d) Formule des espérances mathématiques itérées : si A, € A, € Y%, 
9%, et À, étant des tribus, 


E( No) = E(EG/:)/o) 


. © Passage à la limite sur la condition dans une espérance mathéma- 
tique conditionnelle : soient %, des tribus: A. CU,CU et As la 
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plus petite tribu contenant (J 4, alors 
& 


E(£/AS) = lim E(é/X,). 


Æ—» 


1.7.5. Méthodes de calcul des fonctions de répartitions conditionnelles. 

Soient 5 ct 7 deux variables aléatoires. Désignons par %, la tribu des 

ensembles de la forme {w : 7€ B}, où B sont les boréliens de la droite. 

Cette tribu est dite tribu engendrée par la variable y. La fonction F:(xM,) 

est dite fonction de répartition conditionnelle de la variable £ sachant 

Cette variable aléatoire est {,-mesurable, donc c'est unc fonction borélienne 

de 7. Désignons par F«(x/n = y) sa valeur pour 7 = y. Si /,(y) est la densité 
de probabilité de », alors 

1 

Fax = y) = -—- > 

eCv/n = y) 1,6) à 

où Fe,,(x, y) est la fonction de répartition conjointe des variables &£ et 7. 

Si existe la densité conjointe /4 ,(x, ») des variables & et », alors l'expression 


1 
Jen = y) = 1,0) ns ») 


définit la densité de probabilité conditionnelle de la variable £ sachant ». 


0 
nm F, ë, ns »}, 


ES OP (x 
ED = 9 = pop [ha Ra» 


cest l'espérance mathématique conditionnelle de la variable £ sachant n. 
Soient &,,...,8,, M -..,7, des variables aléatoires, 4,,,..,,, la 


tribu engendrée par 71, ..., M, C'est-à-dire la tribu des ensembles de la 
forme 


{o : (7 (@), ..., n.(@)) € B}, 


où B sont les boréliens de R" ; (71, ..., 7.) le point de R" de coordonnées 7. 
La fonction 


Fer 2229 Fa) gg cm) © 


= P({A {ow : E(@) < fe. ) 


s'appelle fonction de répartition conditionnelle conjointe des variables 
En, ..., 5% SAChant 7 ..., 7. Cette quantité aléatoire est une fonction 
de 7n ..., 7, On désignera par 


re, case ALITEEET (2 d'en X [Ya ...) n) 
sa valeur pour 74 = Jin ces Mn = Vue Si Mn ..., M, admettent la densité 
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de probabilité conjointe ES C4) alors 
Fe, ETS NL IT RS CIC 1 X Va 0.1 Ya) = 


| 0 F 
Sn n(r ...s Ya) Ôy, ... Op, En lincsote 


A ÉSTREETE AUTRES À | 


X 


OÙ Femme © Xe d'u ces YA) 6St la fonction de répartition 
conjointe des variables &,, ...,Ë., 71, ...,”.. Si existe la densité con- 
jointe fe. emma << Xmr Vis =. YA) des Variables &,, ..., &,, 
Mas . Pa AÏOTS 


Le Entnu nn 0 Xe pc Ye) © 
= (CURE CT .., Dan) nus Ene mue ma .. X n° Yi» ses Vs) 


est la densité conditionnelle conjointe des variables &,, ...,£, sachant 
QUE Mi = Vis cs Mn = Ya 


1.7.6. Indépendance. On dit que des événements À et B sont indépendants 
si P(ANDB) = P(4) P(B). Pour de tels événements on a 
P(4/B) = P(4), P(B/4) = P(B). 
Une variable £ est indépendante d'un événement À si 
Fa(x/A) = Fax). 
Un événement À est indépendant d’une tribu A, si presque sûrement 
P(A/o) = P(4). 


Pour que À soit indépendant de A,, il faut que À soit indépendant 
de tout événement B € Y,, et il suffit que À soit indépendant des événe- 


ments d’une algèbre %, telle que X, soit la plus petite tribu contenant do. 

Indépendance de tribus. Deux tribus %, et %, sont indépendantes 
si P(ANA,) = P(4)P(4,) pour tous AEU,, A, EX. Une variable & 
ne dépend pas de %, si la tribu %4 qu'elle engendre et A, sont indépen- 
dantes. Pour cela il est nécessaire et suffisant que 


Fax fo) = Faux) 


presque sûrement. Des variables £ et 7 sont indépendantes si les tribus 
Me et A, le sont. Pour les variables indépendantes & et 7, on a 


Fe, ns 1) = Fe(x) FU), 


où Fe, (x, u) est la fonction de répartition conjointe de £ et de 7; Fux) 
et F,(u) sont les fonctions de répartition respectivement de & et de 7. 
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Des variables £,, ...,£,, sont indépendantes dans leur ensemble si 


ATA CITES ps À ») = Fe (x1) se Fe (%x). 
Deux systèmes RE de variables {£,,..., €.) et {7:, ...,n,) sont 
indépendants si 
Fe, do Cr sas Rae Var Ye) = 


= Fa, . e(r ... Xn) Fi. . 0, >. 0 Ya), 
Fe, Et Fe. ÉEE étant der les fonc- 
tions de répartition conjointes des variables (Es cs ads (ns 5 md 


(us. 7). Si les systèmes de variables {Ë,, ...,£,,}) et {n:, ..., M 
sont indépendants (on dit encore que &,, à sont indépendantes de 


Mis +. Ta), AÏOTS 
Fe, sc. Elie 0 m1 .. Xn/Ya .….s Ya) = Fe, CD 3 Xn ). 


Soit U(4:, ..., 4.) la plus petite algèbre contenant les ensembles 
Au... 4, Les événements 4,, ..., 4, sont dits indépendants si pour 
tous &£ = 1,2,...,n, l'événement 4, ne dépend pas de l'algèbre 
U(A1 -.. A3 Aayn -.. A). Si les événements 4, sont indépendants, 


alors 
P Al = TT P(4,). 
(A4) - fre 
Les événements 4,,..., 4, sont indépendants si et seulement si 
pour tous 1æ&f<is<... <h<nmen, 


P A,l= TITP(4A,). 

(A4) - free 

Exemple. Supposons qu'on tire une boule dans une urne qui 

en contient quatre, trois portant respectivement les numéros 1, 2, 3, la 

quatrième, ces trois numéros à la fois. Désignons par 4,, i = 1, 2, 3, l'événe- 
ment : la boule tirée porte le numéro ÿ. On a pre 

P(4,) = P(43) = P(43) = 


P(A1N 42) = P(A4:N243) = P(A: NA 


= = = 


P(A;N A3 A3) RE HS | 


si bien que les événements 4,, 4,, 4, sont deux à deux indépendants, 
mais pas indépendants dans leur ensemble. 
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Chapitre 2 


SUITES D'ÉVÉNEMENTS 
ET DE VARIABLES INDÉPENDANTS 


2.1. Lol de tout ou rien 


2.1.1. Théorème de Borel-Cantelll. Soient {4., n æ 1} une suite d'événe- 
ments (on suppose qu'est donné l’espace probabilisé (92, X, P) et 4, € M). 
L'événement : une infinité d'événements 4, a lieu, s'appelle limite supé- 


rieure de la suite {4,, n æ 1}et se note lim 4,. On appelle limite inférieure 
de la suite {4,, n > 1} et on note lim À, l'événement : seul un nombre fini 
d'événements 4, est réalisé. On a les relations 


lim 4, = al Ü An im 4, = Ü O4 


Une suite d'événements {4,, n > 1} est une sulte d'événements indé- 
pendants si les événements 4,, 4, ..., 4, sont indépendants pour tout 


n, c'est-à-dire 
Le) a 
P{n 4,) p IT P(4,) 
Es]! Em! 


pourtous ne 1,2,...,1&f<i;< ... <i, < oo. 
Théorème de Borel-Cantelli. 
1. Si une suite d'événements {A,, n > 1} est telle que Ÿ P(A,) < ©, 


alors P(fim 4.) = 0. 

2. Si une suite d'événements indépendants {A,, n > 1} est telle que 
S P(A,) = + co, alors Plim 4,) = 1. 

Ce théorème dit que pour une suite d'événements indépendants 
{4,, n > 1} l'événement lim 4, apparaît avec la probabilité 0 ou 1. 


2.1.2. Loi de tout ou rien de Koïlmogorov. Soit {%,, 7 > 1} une suite de 
tribus d'événements (4, € A). Désignons par (J Y, la plus petite tribu 


contenant toutes les tribus %,, n = m et par lim, latribu fN U 4. 


Sul som 


c'est-à-dire la tribu des événements appartenant à la tribu |} Y, pour 


tous les mn = 1,2, ... 
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Une suite de tribus {{,, n > 1} est une suite de tribus indépendantes 
si toute suite d'événements {4,, n = 1} telle que 4,€ À, cst une suite 
d'événements indépendants. 

Théorème. Si (X,, n > 1} est une suite de tribus indépendantes, tout 
événement de la tribu im À, possède la probabilité 0 ou 1. 

On dit qu’une suite de variables aléatoires {&, kæ 1} est une suite 
de variables aléatoires indépendantes si la suite des événements {é, < x:}, 
k = 1,2, ...,cst une suite d'événements indépendants pour tous les réels 
Xe Si E, n > 1} est une suite de variables aléatoires indépendantes et 
SX Xe se Xm une fonction d’une infinité de variables x, telle 
que & = SE, ..., 8, ...) est mesurable par rapport à lim%,, alors la 
loi de tout ou rien : que ê prend une seule valeur avec la probabilité 1. 
En particulier, pour les variables he a en se {&,,k= 1) 


les quantités limé, et limé,, lim — r> 2 lim — > £, sont presque 
sûrement constantes. Pour la suite de variables aléatoires indépendantes 


{E,, k > 1} la série ) &, converge ou diverge presque sûrement. 
Emi 


2.2. Suite d'épreuves de Bernoulli 


2.2.1. Loi binomiale. Soient 4,,...,.4, des événements indépendants 
ayant chacun la probabilité p. Posons q = 1—p et soit » le nombre des 
événements 4, apparus. Alors » est une variable aléatoire binomiale, 
c'est-à-dire 


B,(n, m) = P{v = m} = CrprqT", m=0,1,...n. (2.1) 


Dans la pratique, on a souvent affaire au schéma suivant dit suite 
d'épreuves de Bernoulli : on réalise 7 épreuves indépendantes (au sens 
probabiliste), le résultat de chacune d'elles étant un événement À de 
probabilité p. La probabilité que dans une série de n He l'événement 
A a lieu mn fois est égale à B,(n, m), m = 0, 1, 2, 

Exemple. Supposons que la probabilité de caède article produit 
dans une usine d'être défectueux est égale à p. La probabilité que dans un 


lot de n'articles m au plus soient défectueux est 2 B,(n, k). 


Le nombre noie d'apparitions de l'événement À dans une série 
de n épreuves et Si B,{n, m) = np. 
mm0 


La variance du nombre d'apparitions de l'événement 4 dans # épreuves 
est égale à 9° m'B,(n, m)—n°p? = npq. 
m=0 
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Si #1 tend vers n, les probabilités B,(17, m) croissent puis décroissent 
en atteignant leur valeur maximale pour »1 = [np+p], si np+p n'est pas 
entier ; si, en revanche, np+p est entier, elles présentent deux maximums : 
B,{n, np+p) et B,{n, np — 4). 


2.2.2. Loi polynomiale, Supposons que chacune des nr épreuves indépen- 
dantes amène l’un des m événements 4,, 4:,..., À, respectivement des 
probabilités p,, Ps, ..., Pur Pit Pat ... +Pn = 1, Mmæ0. Soit v, le 
nombre d'épreuves amenant l'événement 4,, i = 1,2, ...,m. Alors 

n! 


SRE P\PE .…. PE, (2.2) 


P{v; = ls Va = los cos Vm © m} = TR! 


où 4 æ=0et iÿ+ist+ ... +1, = n. Cette loi est dite polynomiale. Pour 
m = 2 elle est binomiale. 


2.2.3. Approximation binomiale de la loi hypergéométrique. Supposons 
qu'on effectue un tirage exhaustif de £ objets parmi n, composés de mn, 
objets de type I et de », de type IT (n,+n, = n, k = n). Soit v le nombre 
d'objets de type I dans le tirage. La loi de vest appelée hypergéométrique 
et est définie par 


PC m) = Pb=m =, m=0,1,2,..., min (k, m). 


(2.3) 
Pour 1 + c et _ — p on a la relation 


PK, M) — B,(k, m), 


de sorte que la suite d'épreuves de Bernoulli peut être considérée comme 
un tirage exhaustif d’une infinité d'objets. 

De façon analogue, supposons qu’on dispose d’une suite de »# objets 
composés de n, objets de type £, i = 1,2, ...,r, et qu’on effectue un tirage 
exhaustif de k objets. Si v, est le nombre d'objets de type ÿ dans le tirage, 
on a 


P{v, = m, = M} Frs © 
MikmMat ... im=k0<MENn, Ntnst ...n, = n. Pour ñn-— 00 


ny n, 
et n Pr …. n Pr" 
k! 
m! ma! . 
c'est-à-dire on obtient des probabilités polynomiales à la limite. 


Pr, =m,...,v, = m,)— pr Pi Ps Fr 
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2.3. Théorèmes limites pour la suite d'épreuves de Bernoulli 


2.3.1. Loi des grands nombres. Soit », le nombre d’apparitions d’un 
événement À dans une suite de n épreuves indépendantes, p la probabilité 
de l'événement À dans une épreuve. Pour tout € > 0 on a alors 


: LA 
lim P Ps P 


 —+ 


= e} = (0. (3.1) 


On dit qu'une suite de variables aléatoires {£,, n = 1} converge en 
probabilité (ou stochastiquement) vers une variable aléatoire Ë si pour 
tout e > 0 

lim P{I£,—8] > 8} = 0. 


mn — © 


Donc, (3.1) veut dire que la fréquence _ d'apparition de l'événement 


A dans une série de n épreuves indépendantes converge en probabilité 
vers la probabilité p d'apparition de l'événement 4 dans une épreuve. 


2.3.2. Approximation normale de la loi binomiale. Les probabilités B,(r1, m) 
sont parfois très difficiles à calculer pour de grands n. C’est pourquoi il 
est très important de trouver des formules asymptotiques pour B,(n, m) 
lorsque n + co. 
Théorème de Moivre-Laplace. Posons np = a, npq = Bi, x,, = 
m—a, 


= D: Si B, — © pour n + et x, est borné, alors 
3 


Tim = = 1, (3.2) 


Ce théorème est valable également pour le cas où x, est borné et 
p et q dépendent de n mais de telle sorte que B, -> «. 

Théorème limite intégral de Moilvre-Laplace. Si l’on se place dans 
les conditions du théorème précédent pour x1 < x+ quelconques, on a la 
formule asymptotique 


4 a 
Pl < — < «à n = (| e ? dt, nc, (3.3) 


où v, est le nombre d’apparitions de l'événement À dans une suite de n épreuves 
indépendantes, si la probabilité de l'événement À dans une épreuve est égale 


à p. 
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Il est équivalent de dire que la variable — est une variable asymp- 
V npq 


totiquement normale réduite. 


2.3.3. Approximation poissonnienne de la loi binomiale. Supposons qu’on 
cffectue une suite de n épreuves indépendantes ct que la probabilité p 
d'apparition de l'événement À dans une épreuve dépend de # de telle 
sorte que la suite b, = np,q, soit bornée. 


Si b,—+0, soit p,—+0, soit 49,0 pour nc», 
Dans le premier cas 


n b, | bn 
B, (n, 0)=g (1-*) ve "oi. 


Donc 
5 B, (n, m) = 1—B, (n, 0) 0 pour n-—+0c, 


Dans le second cas 
B, (n, n)x1 ct 5 B,, (n, m) -> 0. 


Considérons maintenant le cas où il existe des constantes C, et C: 
telles que 0 < C, < Cy<o et C, < b, < C, pour tous les nr. Alors, 
soit p, —+ 0, soit q, -> 0. Ftudions le premier cas, le second s’y rapportant 


grâce à la relation 
B,(n, m) = B{(n, n—-m). 


On a q, — 1, puisque p, — 0, et par suite b, = a, = np.. 
Théorème de Poisson. Sf des constantes C, et C, sont telles que 
0O<C, <a, = C3 < ©, alors pour tous les m = 0, 1, ... 


B, Un, m) = et, (3.4) 


En particulier, si a, — a pour n-> , le nombre », d'apparitions de 
l'événement À dans une suite de n épreuves indépendantes suit sous les 
conditions indiquées une loi de Poisson asymptotique de paramètre a. 

2 


La formule (3.4) est vraie aussi dans le cas où np? —+ 0 ct + 0 
pour ñn —+ co, 
2.3.4, Comportement asymptotique des probabilités polynomiales. Posons 


n! 
mil ma! CE 


OÙ Mit Mat co M =N, M æ 0, PitPet ... +p=1, n> 0, 
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Pas Mas cos M) = mi Pr PE" De 


r est un enticr fixe (7 = 2). Si np, = @y, Pa = An... NP, = 4,_-1S0nt 
bornés, alors pour n -> © 


PAM, ..., M) 


a aj'as" apré tit er (3.5) 
mitntel ... mt, 1! ” j 
r--1 
OÙ Mis Mas... M, 1 SONt des entiers positifs arbitraires, #1, = n— À [PR 
ss 


Si r peut aussi varier avec n, ct que toutes les variables a,, a, ...,4,_x 
a, = np, Soient bornées, alors pour des entiers positifs quelconques 
Ms Mes ces PM, ON À POUT A —+ co 


. a, (3.6) 


V'2ane-" = 
LA CT Ms, ... ni,) Le 4 ST RE A; 
Mi: . . 


m,! 


2.4, Suites de variables aléatoires indépendantes. 
Loi des grands nombres 


2.4.1. Critère d’indépendance d’une sulte de variables aléatoires. Nous 
avons introduit la notion de suite de variables aléatoires indépendantes 
au numéro 2.1.1. Soit {£,, n > 1} une telle suite. Désignons par Y, la 
tribu des événements de la forme {£,€ 4}, où 4 est un borélien de la 
droite. La définition d’une suite de variables indépendantes nous dit que 
la suite des tribus {%,, » = 1} est une suite de tribus indépendantes. Voici 
encore un critère d'indépendance de variables aléatoires. 

Théorème. Pour que des variables £;, £., ...,&, soient indépendantes, 
il est nécessaire que pour toutes les fonctions boréliennes bornées g1, ..., £, 


Eg,(é) ….. Eg,(£,) Fe Eg,(é) Eg,(£2) … Ep, (£,), 

et suffisant que cette égalité soit réalisée pour toutes les fonctions bornées 
continues &y, -.., En 

En particulier, si £,, £., ...,£, sont indépendantes et EË, (k = 1,...,n) 
existe, on a 

EII& = ITE4. 
(= (1 
Pour les variables aléatoires indépendantes £,, ..., ê, 
; 


Var Li = 2 Ver, 


pourvu qu'existent Var &,, k = 1,2,...,n. 

Si deux systèmes complets {£,, ..., £,}et {£, ..., &,} de variables 
aléatoires sont indépendants, alors les variables aléatoires £ — 
= f(£:, .., Jet & = 8 1 m) où TAGS .. X) et 801 …s Ym) 


sont des fonctions boréliennes quelconques, sont indépendantes. 
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2.4.2. Inégalité de Tchébychev. Soient £ une variable aléatoire quelconque, 
g(x) une fonction positive paire croissante sur [0, +-[. Pour tous les 


az Oona Eeté @) Ext) 
Eg()-8@) _ pue n = E86 
+ raO P{Iél = a} Cd (4.1) 


La quantité sup p.s. g{é), qui s'appelle supremum presque sûr de la variable 
aléatoire g(é), se définit comme suit : 


sup p.s. g() = inf{C: Cæ>0 et P{g(é) > C} = 0}. 
Dans (4.1) en posant g(x) = |x/", r = 0, on obtient 
Elé|l"-+ E —_—. 
En appliquant cette inégalité à la variable £ — E£, on obtient 
El|£-Eé|"-a E|$—ES 


ons ln ESS: 2É 0 —-Eil = — ; 
sup ps. lé El < P{I£-E{] > a} < o (4.3) 
Pour r = 2 on déduit l'inégalité de Tchébychev : 
P{E—ESI 2 0) RE. (4.4) 


2.4.3. Convergence en moyenne. Une suite de variables aléatoires {£,, n = 1} 
converge en moyenne d’ordre r, r > 0, vers une variable aléatoire é si 
lim Elé,—-é| = 0. 

#5 —+ © 


La convergence en moyenne d'ordre 2 s'appelle convergence en moyenne 
quadratique. Si £, + £ en moyenne d'ordre r, alors &, + £ en moyenne 


d'ordre r pour tous les r’ & r et E|Ë,|” + Elé]". En appliquant l'inéga- 
lité de droite dans (4.2) à la variable &, —é, on remarque que la convergence 
en moyenne d'ordre 7, r > 0, entraine la convergence en probabilité (ou 
convergence stochastique). L’inégalité de gauche dans (4.2) exprime la 
réciproque : si une suite {£,, # = 1} converge en probabilité et est presque 
sûrement uniformément bornée, elle converge également en moyenne 
d'ordre r pour tout r > 0. 

Une suite de variables aléatoires {&,, n = 1} est dite équi-intégrable 
(ou uniformément intégrable) si 


lim sup  [ 1é,14P(o) = 0. 
6 + 0 h {lél >6) 
Pour que &, + £ en moyenne d'ordre r, il est nécessaire et suffisant 
que &, + £ stochastiquement et que la suite [£,|" soit équi-intégrable. 


Soient g(x) une fonction borélicnne définie sur la droite, À l'ensemble 
des points de discontinuité de g(x). Si la suite {&,, » = 1} converge 
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stochastiquement vers une variable aléatoire & et P{È € 4} = 0, alors g(ê,) 
converge stochastiquement vers g(). Si, de plus, sup Elg(é,)1* = C <o 


pour un r, > O,alors g(ë,) — g(é) en moyenne d'ordre r pour tout r < ro. 
En particulier, si £,-—> Ë£ stochastiquement, ,alors lim P{É, < x} = 


An —+ 00 


= P{é < x} pour tout x tel que P{É = x} = 0. 


2.4.4. Loi des grands nombres. C'est ainsi qu'on appelle les théorèmes 
définissant les conditions sous lesquelles 

| 1 © 

ner ad 
stochastiquement. Le numéro 2.3.1. contient une proposition de cette 


nature concernant une suite d'épreuves de Bernoulli. On remarquera que 
si », est le nombre d'’apparitions d’un événement À dans une suite de n 


épreuves indépendantes, alors », = D» &, où é, est une variable aléatoire 
1 


égale à 1 si À est réalisé dans la i-ème épreuve et à 0 dans le cas inverse. 
Alors 


Traitons un problème plus général. Soient données une suite de 
variables aléatoires indépendantes {£,, 7 = 1,2, ...} et une suite de 
nombres {B,, n = 1, 2, ...} telle que f,-+ c avec n. On demande les 
conditions d'existence d’une suite de nombres {o«,, n = 1, 2, ...} telle 
que pour 11 —+ co 


1 n 
Er 2,7% + 0 


stochastiquement. La solution est donnée par le théorème suivant. 
Théorème 1. Soient {£,, næ 1} une suite de variables aléatoires indé- 
pendantes, F,(x) = P{E, < x}. Désignons par m, la médiane de la variable 


1 
aléatoire &,, c'est-à-dire tout nombre vérifiant les inégalités P{£, = m,}) = 7 


l , ss 
et P, «m,} = —. Une condition nécessaire et suffisante d'existence d’une 


2 
suite de constantes {x,, n æ 1} telle que 
1 sn 
2 D, Ée—n —+ 0 
ñn k=1l 


stochastiquement pour n -> ©, est que 
ff (x—m)? 
>» D + 0, 4, 
= Bi+(x—m)" PR De, 
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Si cette condition est réalisée, on a 


1 
y = .,- nt 
" Pa à : 
|2— 2] < Ta 


où t est une constante positive arbitraire. 

Le théorème suivant donne les conditions d'applicabilité de la loi 
des grands nombres dans sa forme classique à une suite donnée de variables 
aléatoires indépendantes. 

Théorème 2. Soit {ë,, n > 1} une suite de variables aléatoires indépen- 
dantes, Fix) = P{ËE, < x}. Supposons que Eli <o, k = 1,2, .... 
Une condition nécessaire et suffisante pour que 

1 CL 1 LC] 
n À & n D Eës — 0 


&=] 


(VX — 11) #Fas)} + o(1), 


stochastiquement pour n —+ © est que 


DY  [ dnw-0; 
DS [| @-Endntw-0; 


3) - L ÿ J (x —Ei,)* dFi(x) — 
it Efal <n 


— J (x — Eé,) 44a)} | — 0. 


|s- Es] <n 


Le théorème suivant exprime une condition simple d'applicabilité 
de la loi des grands nombres. 
u .: Théorème 3. Siune suite de variables aléatoires indépendantes {£,, n = 1} 


; Var 
est telle que Var &, existe et — 0 pour n + ©, alors 


| Le 
PE Pr, 0 
1 À $. n À Eës 


stochastiquentent. 
Des variables &,, n = 1,2, ..., admettant la même fonction de 
répartition F(x) = P{E, < x} sont dites identiquement réparties. 
Théorème 4. Si{£,, n > 1} est une suite de variables aléatoires indépen- 
dantes identiquement réparties et existe l'espérance mathématique E£, = a, 


alors 
RS - E 
—— + 
n À s 
stochastiquement pour n —+ ©. 
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2.5. Inégalité de Kolmogorov, 
Loi forte des grands nombres 


2.5.1. Inégalités de type inégalité de Kolmogorov. 
Théorème 1 (Kolmogorov). Si des variables aléatoires indépendantes 


Ego ar ce.) Ém SON re et Varé, < ©, alors pour tout a > 0 
P — 
{max LE Ef,| > a) « ) Var &. (5.1) 
Si, de plus, É æ& C << pour tous les k = 1,2, ..., n, alors 

2 - 
D > (G-E|=at>=1- CE, (5.2) 

{mer (mi Ÿ Varë, 

=! 


La loi d'une variable & est dite symétrique si les variables à et —£& 
sont identiquement réparties. Une variable £ ayant une loi symétrique est 
dite symétrique. Si F(x) est fonction de répartition d’une variable aléatoire 
symétrique, alors F(x) = 1—F(-x+0). 

Théorème 2. Si des variables £,, £a, ..., &, sont indépendantes et symé- 

ÿ ÙT 


triques, alors 
P{ max >a) « 2P{ D&l> a}. (5.3) 
lmkcnls=i, (= 


se . Théorème 3, Si des variables &,, £s, ..., €, sont indépendantes et pour 
certains a > Oeta < 1 


P{| > £ 


{=st1 


>da)}«u, kK=1,2,...,n—1, 


alors pour tous les C > 0 


P{,mex Dé 


im] 
2.5.2. Convergence presque sûre. Une suite de variables aléatoires 
(£ 1 æ 1} converge presque sûrement (ou avec la probabilité 1) vers une 
variable aléatoire € si 


P{o : |E,(w)—E(w)| + 0} = 


Une suite &, + £ p.s. (presque sûrement) si et seulement si pour tout 


e 0 
Pl U (lËn+m— €} > 0 


> c}. (5.4) 


>atC}< P{| > 


k=i 


pOur 71 —+ co, | 
La convergence presque sûre entraîne la convergence stochastique. 
La réciproque n'est généralement pas vraie. Cependant, toute suite é, 


4, 


convergeant stochastiquement vers Ë renferme une suite partielle conver- 
gcant presque sûrement. Bien plus, &, -> & stochastiquement si et seulement 
si toute suite partielle de la suite &, contient une suite partielle convergeant 
presque sûrement vers &. Le théorème de Borel-Cantelli nous dit qu'une 
condition suffisante de convergence presque sûre de &, vers Et cst la con- 
vergence pour tout e = 0 de la série 


ÿ P{Ié,—-él > e}. 


2.5.3. Loi forte des grands nombres. On appelle ainsi les théorèm s similaires 
aux lois des grands nombres et qui, au lieu de la convergence stochastique, 
affirment la convergence presque sûre. 

La manière la plus générale de formuler le problème est la sui- 
vante : étant données unc suite de variables aléatoires indépendantes 
{En = 1,2,...}etunesuite de nombres B, telle que f, > pour 7 > ,on 
demande les conditions d'existence d’une suite de nombres {a ,n = 1,2,...} 
telle que pour n -> co 


1 Li 
= D = En LS 0 
n =! 
presque sûrement. 
Théorème 1. Soit donnée une suite de variables aléatoires indépendantes 
(En = 1,2, ...}. Supposons que B, > > avec net qu'il existe une suite 
partielle B,. et des nombres Ch Ca tels que pour tous les k assez grands on ait 


Posons 
. Song — Says 
S, = Y ê» T, = ——— , k=1,2..,5, = 0. 


Pour que 

1 

— (S,—mS,) -> 0 
Ba 
presque sûrement pour n + ©, il est nécessaire et suffisant que soit réalisée 


l’une des conditions suivantes : 
1) T-mT — O p.s. pour k —+ © ; 


2) > P{IT,-mT,l æ €} < pour tous e > O0; mS, et mTs dési- 


gnent les die des variables aléatoires S, et T, respectivement. | 

Le théorème suivant contient une condition suffisante (commode à 
vérifier) d'applicabilité de la loi des grands nombres à une suite de variables 
aléatoires indépendantes donnée. 
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Théorème 2. Si{£,, n æ 1} est une suite de variables aléatoires indé- 


pendantes telle que la série D Var à 
1 


gr converge, alors 


1 
n D Tr À Eh — 0 


presque sûrement pour n -> co. Le théorème suivant est relatif aux variables 


identiquement réparties. 
Théorème 3. Si{i,, n = 1} est une suite de variables aléatoires indépen- 


dantes identiquement réparties telles que EË, soit finie, alors 
+ È a > Eë: 

presque sûrement. 

Si l'espérance mathématique des variables £, n'est pas finie, la suite 
— à &, est presque sûrement infinie. 

“Corollaire. Si », est le nombre d’apparitions d'un événement 4_dans 
une suite de n épreuves indépendantes, alors = — p presque sûrement 
pOur ñ —+ co, p étant la probabilité de l'événement À dans une épreuve. 


2.6, Séries de variables aléatoires indépendantes 
Soit {&,, 7 æ 1} une suite de variables aléatoires indépendantes. On dit 
que la série È &, converge presque sûrement si les sommes partielles 
px &, convergent presque sûrement pour ñ -> co. 

Théorème 1. Soit (En 1 > 1} une suite de variables aléatoires indépert- 
dantes. Si les séries È Eë, et > Var é, convergent, la série È &, converge 


presque sûrement. Réciprogiement, si les variables Ë, sont Dreraié sûrement 
bornées (P{IÉ,1 > C} = 0 pour tous les n «4 pour un C > 0) et Ja série 


ÿ £, converge presque sûrement, les séries Ë Eë, et È Var &, convergent. 


Théorème 2 (des trois séries). Pour qu’ ve série de Paroblés aléatoires 
indépendantes {£,, n = 1} converge presque sûrement, il est nécessaire que 
pour tout C > 0 et suffisant que pour un C > 0 convergent les séries 


Értai=c, SEC, Ë Varatc 
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où 
ds si läl«cC, 
C) = j 
fc) O0 si lél=c. 
Théorème 3. Si {£,, n = 1} est une suite de variables aléatoires positives, 
alors pour que la série Y Ë, converge il est nécessaire que pour tous les 


&=1 
C > 0 et suffisant que pour un C > O convergent les séries 
SP >C) et À Eë,(C), 


où 


A si , <C, 
EC) = : Re 


On dit que la série > €, est stochastiquement convergente si ses sommes 


partielles le sont. La toi stochastique des séries de variables 
aléatoires indépendantes entraîne leur convergence presque sûre. 

On dit qu'une suite de variables aléatoires {n,, 7 æ 1} est bornée en 
probabilité (ou stochastiquement bornée) si 


lim sup P{Ir,| > 4} = 0. 
Arte n 
Si {é,, 1 æ 1} est une suite de variables aléatoires indépendantes symétriques 


et ÿ° &, sont bornées stochastiquement, la série Ÿ° £, converge presque 
&=1 B=l 


sûrement. 
On obtient des résultats analogues pour des sommes de vecteurs aléa- 
toires indépendants. Ainsi l'analogue du théorème des trois séries est le 


Théorème 4. Soit ÿ &, une série de vecteurs aléatoires indépendants. 
&s!l 


Pour que cette série converge presque sûrement, il est nécessaire que pour 
tous les C > 0 convergent les séries 


> E£,(C), pi El£(C)-E4 CC), Z PU > C) 


et suffisant que ces séries convergent pour un certain C > 0. 
£,(C) est un vecteur défini par 


| ; 
&(C) = É RE 


si lé,l>cC. 
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Chapitre 3 
OUTIL ANALYTIQUE 


3.1. Fonctions génératrices 


3.1.1. Définition, propriétés. Soit » une variable aléatoire positive à valeurs 
entières, dont la loi de probabilité est définie par : 
P{v = k} = P:, k=0 1 2.::;: (1.1) 
On appelle fonction génératrice de la variable aléatoire » la série 
p{z) = Ez’ = D zip, |zl=<1. (1.2) 
k=0 
La fonction génératrice conjointe d’un système de n variables aléatoires 
positives à valeurs entières est définie par la série 
PE 2». 2) = Esnzn ,,,20 = » 2\zs Pr ZPan, he 
K, Ka .. k, > 0, (1.3) 


où 
Pr... P{r, ke kn..,v= k,}- 


La fonction génératrice est analytique dans le disque unité |z] < 1. 
La loi de probabilité (1.1) est définie de façon unique par sa fonction 
génératrice : 


k 
Pa = TP OO, PO) = Er pen k>0. (14) 


Il est souvent utile (notamment en analyse asymptotique) de définir la 
loi par une intégrale de Cauchy : 


1 p() 
Dr J FF de, 0<p<l. (1.5) 
lsl=0 
Définissons la queue de la loi 
Pt >=k}=4= 2, Pate k > 0. __ (1.6) 


Entre la fonction génératrice Q(z) = }° zq, de la suite {g,, & > 0} et la 
k=0 
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fonction génératrice p(z) de {r,, k æ 0} on a la relation 


__1-pG) 
Q(2) ES 1—7Z . (1.7) 
En particulier, l'espérance mathématique Er est donnée par 
Er = Q() = L &. (1.8) 
0 


Les moments factoriels El") = Ef{y(v— 1) ... (v—m+1)] de la variable 
aléatoire » sont définis par 


Et") = T P()kbun  M>æ ll. (1.9) 


En, particulier, l'espérance mathématique Ev et la variance Var v 
sont données par 


Ev = pl) ; io 


Var v = p“(1)+p'(1)-[P'(DF. 
Pour calculer les moments factoriels, on peut aussi développer la 
fonction génératrice en série : 


L 1 
_ m vs La) 
p{z+1) À: Bu Ba Et", (1.11) 
Si la fonction génératrice p(z) de la variable aléatoire v est définie 
pour tous les |z| < z,, Z, étant un nombre quelconque > 1, tous les 
moments »1, = Ev*, k 1, cxistent et sont définis par la fonction généra- 
trice 


ARE 
P(s) = p{e') = — M. 1.12 
GO = pe) = L rpm (1.12) 
La fonction génératrice admet une signification géométrique sur l’inter- 
valle ]0, 11 : 
p(s) = P{væt}, 5€)]0,1If (1.13) 


où 7 est une variable aléatoire indépendante de » et ayant une loi géomé- 
trique de paramètre s : 


P{t=k}= s(1-s), k=0 (1.14) 
de fonction génératrice 


s 
= T — ol 
Pi(z) = Ez 1: (1.15) 
La relation (1.13) exprime que p{s) = Es” est la probabilité que le 
nombre » de succès dans une épreuve ne soit pas plus grand que le nombre 
t de succès dans les épreuves de Bernoulli, la probabilité d’un succès dans 
une épreuve étant égale à s. 


4 — 26002 4 


Le produit de convolution de deux lois à valeurs entières {p, ; k æ 0} 
et {a ; À > O}cst défini par 


Ë 
Où = ÿ PAi-r = À, Pa-64r kæ0 (1.16) 
r=0 CE 
et se note 
(a: k=>0)}={p; k > 0}k{q ; k > 0). (1.17) 


La loi de la somme y = +» do deux variables aléatoires indépendan- 
tes, de lois respectives {p, ; k æ 0} et {g, ; k æ 0} est définie par le 
produit de convolution (1.16) : 


& 
P{u+v = k} = 0 = À Pin k>0. (1.18) 


La fonction génératrice p,(z) de la somme »v = »,+va+ ... +, 
des variables aléatoires indépendantes est égale au produit des fonctions 
génératrices de chaque variable : 


P,() = P,G)P,,G) ... p,, G). (1.19) 


Soit » une variable aléatoire positive à valeurs entières de fonction 
génératrice g(z) — Ez”. La fonction génératrice p,(z) ide la somme 
Ld 


y = ) a des variables aléatoires 4, indépendantes l’une de l'autre et 
k=1 


de », identiquement réparties, de fonction génératrice p(z) — Ez”* est 
égale à la composée des fonctions génératrices g(z) et p{z) : 


PG) = glr()]. (1.20) 
3.1.2. Exemples 
1. La loi binomiale B,(n, k) = Cèp'g"-#{q = 1-p) a pour fonction 
génératrice 
bn, z) = (g+pz}. (1.21) 


Une variable aléatoire binomiale » se laisse représenter par une somme 
= À la de variables aléatoires de Bernoulli, indépendantes, identique- 


ment réparties, de fonction génératrice Pp,) = q+pz, prenant deux valeurs: 
la valeur 0 avec la probabilité g et la valeur 1 avec la probabilité p. 


2. La loi de Poisson p,(a) = Le, k æ 0 (a > 0) admet la fonction 


génératrice 
P{z, a) = er“t-2, (1.22) 


La somme y+v de_variables aléatoires poissonniennes: indépendantes”de 
paramètres a et b est une variable poissonnienne de paramètre a+ b. 
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3. La loi composée de Poisson est définie par la fonction génératrice 

Hz) = ce “tr, p{z) = Ez'. (1.23) 

Une variable aléatoire y ayant unc loi composée de Poisson (1.23) 
» 


est représentable par une somme y = > ua de » variables aléatoires 
E=! 


indépendantes identiquement réparties, de fonction génératrice p(z) = Ez”#, 
le nombre » étant indépendant de LA = 1)et possédant une loi de Poisson 
de fonction génératrice Ez’ = e- 


3.1.3. Théorème de continuité et théorème de Tauber. 

Théorème de continuité. Soit pf) une suite de lois de probabilité de 
variables aléatoires v, à valeurs entières, de fonctions génératrices p (z). 
Pour que ces lois convergent pour tout k æ 0 fini, i.e. 


lim pf) =», (1.24) 


nm —+ co 


il est nécessaire et suffisant que 
lim pA(s) = pt) = ps  VSE (0, U. (1.25) 
mn —> © &s=-0 


On dit qu’une fonction ZL(r) définie sur ]0, + of est lentement variable 
pour £ — si pour tout x > 0 


lim Z(rx)/L(r) = 1. 


La fonction lentement variable Z(s) admet la représentation 
t 
0) = at) exp [ © à, (1.26) 
1 


où e(#) > 0 et a(f) > a <= pour f > , a # 0. 
Théorème de Tauber. Soit a(s) = Ÿÿ a,s" une série convergente pour 
() 


s€(0,I[et a, > 0. On a alors les équivalences (0 =< © < ©) : 
(1—s)" a(s) © 1) pour s-+1—0, (1.27) 


et 


FÈ a © Fa Tc+1 0) pour nr 0. (1.28) 


Si la suite a, est monotone et 0 < c < ©, Ja relation (1.27) est équivalente à 


_ 0 pp; 0) pour + oo, (1.29) 


4° sl 


où 
le) = (] x les dx. 
0 


En particulier, pour L(t) = À les relations (1.27), (1.28) et (1.29) 
deviennent respectivement : 


lim (1—s} a(s) = À; (1.30) 
s—+1—-0 
. 1, A 
Mr 24 Ter): (en 
: GA _ À 
Mr TO Ne 


3.2. Transformation de Laplace 


3.2.1. Définition. Formules d’inversion. Soit £ une variable aléatoire positive 
de fonction de répartition P(x) = P{É = x}. 

On appelle transformée de Laplace p(s) de la fonction de répartition 
P(x) (ou de la variable aléatoire &) la fonction 


pi) = Ee-4 = | e-LdP(x), (2.1) 


0 
définie pour Re À æ 0 et analytique pour Re À > 0. 
On admet que le point 0 est contenu dans le domaine d'intégration. 
Théorème d’inversion. La fonction de répartition P(x) est définie de 
façon ses par sa transformée de Laplace p{À) en chacun de ses points de 
continuité : 


P(x)= lim L, is L. D TA DEA), (2.2) 


—+ © k& 
où 
pa = (—-1} f e7#xt dP(x) 
0 


est la dérivée d'ordre &. 
La transformée de Laplace p(s) peut être représentée par la série 


p(à) = Ÿ CT m, = E8B = J xt dP(x), kzæ1, (23) 
=0 
0 


sur tout intervalle 0 & À < À, de convergence de cette série. Si cet inter- 
valle existe, la suite des moments {m,, k = 0} définit la fonction de réparti- 
tion P(x) de façon unique. 
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La transformée de Laplace P(À) (À = 0 réels) ‘admet une signification 
probabiliste : | | 
PU) = PÉ &tT}, À=>0, (2.4) 


où 7 est une variable aléatoire ne dépendant pas de 5 et possédant une loi 
exponentielle de paramètre À : 


P{r>t}=e"A (2.5) 


et la transformée de Laplace Ee “*" = _— k 
La relation (2.4) admet l'interprétation suivante dans les applications : 
p{à) = Ee”#, À > 0, est la probabilité que le temps (d’un renouvellement, 
d'un appel, d'un refus, etc.) de & ait lieu avant l'instant d'arrêt 7 des obser- 
vations qui est réparti suivant une loi exponentielle. 
Si existe u(x) = P'(x), alors la transformée de Laplace 


p{) = Ee À = Î eux) dx. (2.6) 
(1) 
La formule d'inversion s'écrit dans ce cas : 
LE A TT EL 
= lim (©) p (©). (2.7) 
ou pour presque tous les x = 0 
Ctrl 
d 1! H dÀ 
u(x) = TH 33 ] pU)e* — , (2.8) 
CET 


où c > 0 ct l'intégrale est prise le long de toute droite réelle Re À = c > 0 
et est comprise au sens de la valeur principale, c'est-à-dire comme la limite 
de l'intégrale le long de l'intervalle ]Jc— 54, c+iA[ pour À —+ co. 

Si la densité de probabilité u(x) est continue, alors 


etfo 
u(x) = = J pÜek: di. 


l 


ct 


La fonction de répartition F(x) de la somme & = £+17 des variables 
aléatoires positives indépendantes & et 7 de fonctions de répartition P(x) 
et Q(x) respectivement, est définie par le produit de convolution 


FG) = [ Qtx-») dPG):= | P(x - y) 400) (2.9) 
0 0 


que l'on note F = P#Q. 
La transformée de Laplace p, +nQ) de la somme +7 des variables 


aléatoires indépendantes Ë et 7 est égale au produit des transformées de 
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Laplace de chaque terme de la somme : 


Pen) = P,A) PU). (2.10) 
L'égalité (2.10) est équivalente à 
Ee-lé+m — Ee”ÆEe-An, (2.11) 


Soit v une variable aléatoire positive, à valeurs entières, de fonction généra- 
y 
trice (z) = Ez”. La transformée de Laplace p,(À) de la somme 7 = ÿ & 
k=i 


des variables aléatoires &, indépendantes l’une de l’autre et de », identique- 
ment réparties, de transformée de Laplace p(À) = Ee ” #4 est définie par 
la composée des fonctions g({z) et p{À) : 


La 
+ 


Ÿ € 
PQ) = Ee “*! = gpG). (2.12) 


3.2.2. Théorème limite. Fonctions complètement monotones. 

Théorème de continuité. Si une suite P,(x) de fonctions de répartition 
converge vers une fonction de répartition P(x), leurs transformées de Laplace 
PA(À) convergent vers la transformée de Laplace p{4) de la fonction de réparti- 
tion limite P(x) en tout point À > 0. Réciproquement, si une suite de 
transformées de Laplace p,({À) converge pour tout À > O vers une fonction 
P(à), alors p(à) est la transformée de Laplace de la fonction de répartition 
P(x) et la suite P (x) converge vers P(x). La fonction de répartition limite 
P(x) est propre (P(+ ) = 1) si et seulement si p{à) — 1 pour À + 0. 

Une fonction p(À) définie sur ]0, cf est dite complètement monotone 
si elle admet des dérivées p"(À) de tout ordre et 


(—1} p'Q)>=0, À>0, n>0. (2.13) 


Théorème de représentation. Une fonction p{À) définie sur ]0, cf est 
transformée de Laplace d'une fonction de répartition P(x) si et seulement 
si elle est complètement monotone et p{0) = 1. 

Ce théorème entraine un critère utile de représentabilité d'une fonction 
par la transformée de Laplace d'une loi de probabilité. 

Critère de monotonie complète. 

1. Un produit de fonctions complètement monotones est une fonction 
complètement monotone. 

2. La fonction composée g{p{4)) de la fonction complètement monotone 
g(À) et de la fonction positive p{À), dont la dérivée est complètement monotone, 
est également complètement monotone. 

3. La limite d'une suite de fonctions complètement monotones est une 
Jonction complètement monotone. 

Principe de translation. Si U(x) est une mesure sur ]0, { dont la 


transformée de Laplace u(2) = j e-ÆU(dx) converge pour À > 0, alors 
0 
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la fonction 


- U(A+ a) … e Li 
PU) = = J e-4s dP(x) (2.14) 
est la transformée de Laplace de la loi 
P(x) = D e-eu) (2.15) 
U(a) 0 . 
0 


Le principe de translation permet d'étendre toutes les propositions 
relatives aux transformées de Laplace de lois de probabilité aux trans- 
formées de Laplace de mesures concentrées sur l’axe ]0, of. 

Théorème de Tauber. Pour la transformée de Laplace u(i) = 


= Î e- À: dU(x) de la mesure U(x) les relations (0 & c < co) 
0 


u(À) © 2) pour À—+0 (2.16) 


U(Xx) © =— L(x) pour x -+ 0 (2.17) 


T(c Sa 


sont équivalentes. Si existe une densité monotone U'(x), alors il s'ensuit dv 
(2.17) pour O0 < © < © : 


U' © TO Lx pour x —+ co, (2.18) 
où L{x) est une fonction lentement variable : lim ZL(xr)/L(x) = 1 pour 


tout t = 0. 
Exemple 1. La loi exponentielle P(x) = 1—-e”°’(a = 0) est trans- 
formée de Laplace 


p{) = (2.19) 


Pre S 


Exemple 2. La transformée de Laplace de la loi gamma définie 
par la densité de die vu 


u(x ; 0, a) = To “"" ler, _ x=0, a=0, p=>—0 (2.20) 
est 
e 
Pl ; @, a) = (5) | (2.21) 
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Exemple 3. La loi composée de Poisson est définie par la trans- 
formée de Laplace 


P(à) = exp a I] (e-4—1)4F(x) (a > 0). (2.22) 
0 
La fonction correspondante est 
— —4 S LA) né 
P(x) = e 2 à FX), (2.23) 


où F**(x) est le n-uple produit de convolution de la fonction F(x) par elle- 
même. 
Une variable aléatoire £ de fonction de répartition (2.23) se représente 


La 
sous la forme & = Ÿ° &,, où &, sont des variables aléatoires indépendantes 
&£=0 


de même fonction de répartition F(x), » une variable aléatoire poissonnienne 
de paramètre a, indépendante de &,. 

La notion de transformée de Laplace s'étend de façon naturelle 
aux lois à plusieurs dimensions. La définition (2.1) subsiste dans le cas 
où P(x) = P(xy, Xe ..., X,) Si seulement l'on traite x et À comme des 
vecteurs : x = (xv1, ..., X) et À = (4,, ..., À,) et leur produit x, comme 


n 
le produit scalaire Àx = Ÿ Avi. 
£mi 


3.3. Fonctions caractéristiques 


3.3.1. Définition. Propriétés fondamentales. On appelle fonction caracté- 
ristique d’une variable aléatoire £ de fonction de répartition F(x) = 
= P(È < x) la fonction à valeurs complexes 


SG) = Ee= Î ef dF(x). (3.1) 


En particulier, si existe la densité de probabilité p(x) = F’(x), la 
fonction caractéristique est la transformée de Fourier de la densité de 
probabilité : 


œ 


SU) = | e“p(x)dx. (3.2) 


—œ 


La fonction caractéristique d’une variable aléatoire discrète prenant 
les valeurs x, avec les probabilités p, se représente par la série 


SG) = 2 e""ap,. (3.3) 


La fonction caractéristique est définie pour les # réels pour toute 
variable aléatoire. 


56 


Propriétés fondamentales des fonctions caractéristiques. 
1. f(0) = 1,1/()1 = 1, 1€ ]-c, + of. 

2. f(?) est uniformément continue sur l'axe numérique. 
3. 


Y fa-t)28, > 0, (3.4) 


& 


quels que soient # = 0, les nombres complexes z,, ..., z, et les nombres 
réels #1, ..., !,. Cette propriété exprime que les fonctions caractéristiques 
sont définies positives. 

4. f(—0) = 10). 

5. La fonction caractéristique d'une somme de variables aléatoires 
indépendantes est égale au produit des fonctions caractéristiques des 
termes de cette somme : 


far O = OO. (3.4) 
6. Pour 7 = aË +b, où a et b sont des constantes, on a 
1,0) = fe(at}e't. (3.4) 


Les propriétés 1, 2, 3 sont caractéristiques. 

Théorème de Bochner-Khintchine. Pour qu'une fonction continue f(t), 
définie sur l'axe des réels et telle que f(0) = 1, soit caractéristique, il est 
nécessaire et suffisant qu'elle soit définie positive. 


3.3.2. Exemples. 
1. La fonction caractéristique de la loi normale de densité 


(z—e)! 1 
1 Er TE (et — - out 

— € est f(t)=e 
a 1/27 

2. La fonction caractéristique de la lol uniforme sur l'intervalle | x] < a 
est f(1) = sin af 

_ at 
3. La fonction caractéristique de la loi de Poisson p, = Dee s 


k > Oest f(r) = "9, 
4. La fonction caractéristique de la loi binomiale B,(n, p) = 
= CépA-p}-}, 0<k<n,est f(r) = (q+pe")", (q = 1-p). 


5. La fonction caractéristique de la loi gamma de densité Go x-lerz, 
x>=0,0=0,est f(r) = (1—-it)"C. 


3.3.3. Biunivocité ct continuité de la correspondance entre les fonctions 
caractéristiques et les lois de probabilité. 
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Théorème d'inversion. La fonction de répartition est définie de façon 
unique par la fonction caractéristique f(t). On a la formule d'inversion 
€ 


ete tr 


se. à en 
FD FO) = 3e lim Î SC dt (3.5) 
pour tous points x ct y de continuité de F(x). 
En particulier, si | f(t}/t\ est intégrable à l'infini 
I e” its _L-tty 
FOI FO) = 3 1 LT (0) dt. (3.6) 


Si la fonction caractéristique f(+t) est sommable sur l'axe des réels la fonction 
de répartition F(x) possède une dérivée continue bornée p{x) = F'(x), définie 
par la formule 


P(x) = — Î ef"af(r) dt. (3.7) 


— © 


Pour une loi réticulée on a 


n/a 
Pa = PIE = a+kh) = J f ete +1)/() dt. (3.8) 
— nÎh 


L'égalité de Parseval nous permet d'obtenir diverses formules d’'inver- 
sion. Soient f(f) = Ee“* et g(1) = Ee!"7 les fonctions caractéristiques des 
variables aléatoires indépendantes é et 7 de fonctions de répartition F(x) = 
= P{Ë < x} et (x) = P{y < x}. L'égalité de Parscval est donnée par 


fs 4ro= | Jo dœ0) (3.9) 


Le premier et le second membre de la formule (3.9) sont des formes dif- 
férentes d'écriture de l'expression Ee‘*”. 

L'égalité de Parseval peut encore s'écrire sous la forme de la formule 
d’inversion (avec lissage) : 


en [. »] 


_tu-n | AL 
— le 2 dF)=— le 3 f(t)dt. (3.10) 
27 


—æ 


Les sauts de la fonction de répartition sont donnés par la formule 
r 


F(x+0)—F(x) = Him. _ e-"70 di. (3.11) 
Tr 


Jè 


De sorte qu'aux points de continuité x de F(x) 


La 
1 
li J 4 f(1) dt = 0. : 
ALUEET. e-“f(r) (3.12) 

Théorème de continuité. Une suite de fonctions de répartition F{x) 
de variables aléatoires £, converge faiblement vers la fonction de répartition 
F(x) d'une variable aléatoire £ si et seulement si la suite des fonctions carac- 
téristiques f.(t) de E, converge vers une fonction continue f(t). Ceci étant, 
SO) est fonction caractéristique de la variable £ de fonction de répartition 
limite F(x) et la convergence de [.(t) vers f(t) est uniforme sur tout intervalle 
fini. 

Si une suite de fonctions caractéristiques intégrables [{(t) con- 
verge en moyenne vers une fonction caractéristique f(t), c'est-à-dire 


f 1) —S(0)1 dt > 0 pour n —+ co, alors la suite des densités de probabilités 


PO correspondantes converge uniformément vers la densité de probabilité 
mx). 


3.3.4. Propriétés de régularité. 
1. Si une fonction de répartition F(x) cst absolument continue, alors 


es [f(@)1= 0 
{| —+ co 

2. Si une fonction de répartition F(x) possède une compo- 
sante absolument continue (dans la décomposition de Lebesgue), alors 
ru sup|/(#)| = 1. 

| —+ © 

3. La fonction caractéristique de la loi réticulée p, = P{£ = a+kh} 

cst 


JO = et v: ep, (3.13) 


de sorte que | + à (7 | = 1. Inversement, si |/(#)| = 1 pour un #, # 0 la 


loi correspondante est réticulée. 
Le pas maximal d’une loi est égal à } si et seulement si le module 


| s 27 
de la fonction caractéristique est’inférieur à l'unité pour 0 < |?| < + et 


égal à l’unité pour ? — = à 


4. Pour toute fonction ee fe) existe 


lim : AI OM at= pt (3.14) 


S9 


où p., sont les sauts de la fonction de répartition ct la sommation est étendue 
à tous les sauts. 
5. Si une fonction de répartition F(x) vérifie la condition de Lipschitz 
dans le rapport'y < 1, alors pour T + 
r 
% [ [f@) dr = 0 (T ?). (3.15) 
Cr 
La condition 
[a 1}fG)] dt < > (3.16) 
L) 
entraine que la fonction de répartition F(x) vérifie la condition de Lipschitz 
dans le rapport y. 
6. Soit / (1) une fonction paire positive continue convexe pour # = 0 
ct telle que f (0) = 1, lim /(r) = 0. S'(#) est donc fonction caractéristique. 


1 —> © 
Il s'ensuit qu’existent des fonctions caractéristiques confondues sur un 
intervalle fini ou non, mais non identiquement égales. 
7. Si des fonctions caractéristiques sont de la forme f (#1) = exp P,(r), 
où P,(r) est un polynôme de degré k, alors k = 2, c'est-à-dire f (1) = 


= Cxp {sa - sh. où a et a sont des paramètres réels. 


8. La fonction caractéristique d'une variable aléatoire positive ne 
peut s’annuler sur un intervalle fini. | 

9, Une fonction caractéristique /(r) est réelle (/(1) = (r)) si et seule- 
ment si la loi correspondante est symétrique i.e. 1—F(—-x+0) = F(x). 


3.3.5. Moments et semi-invariants. Les moments d’une variable aléatoire 
£ sont définis par les valeurs des dérivées correspondantes de la fonction 
caractéristique : 


m, = Eif=-#f@9(0), k=> 1. (3.17) 
Si existe le moment absolu a, = E|£|* < , on a le développement 
A st 
f() =1+ ÿ D m, + 0(1*). (3.18) 
Lol . 


| Pour les valeurs de t assez petites la détermination principale Log f(r), 
qui tend vers zéro avec ?, peut se mettre sous la forme 


S (it}* : 
Log j(1) = 2 "ET ve + (1), (3.19) 
&k= . 
où les semi-invariants (ou cumulants) y, sont définis par 
__ 1 [di 
= É Log s®| Re (3.20) 


Les semi-invariants y, et les moments #1, — E£t sont reliés par la 
formule 

= ME CD PE Qu em DIT] (5). G2n 

/ - 11 2% \/! 
La sommation est étendue à toutes les racines positives entières de l'équa- 
tion n+2n2+ ... +knm = K. 

Pour que le moment absolu d'ordre pair a., < existe, il est néces- 
saire et suffisant que / (1) — P.,(1)+-0(1*") pour t — 0, où P., (r) est un poly- 
nôme de degré 2n. 

Pour que la dérivée /'#(0) existe, il est nécessaire et suffisant que 

lim xt(1—-F(x)+F(-x)) = 0; 
Zz + + 
e (3.22) 
lim f x! dF(x) = ms. 


— oo  —6 


Et de plus (0) = it. 


3.3.6. Inégalités. Pour estimer les fonctions caractéristiques on se sert 
de l'inégalité suivante : 


*, GT} gti 


MON —— , 3.2 
LE | SGD: F6 
pour tout n = lets = 0. 
1. Sir > Oet x = 0 sont tels que 7x = 1, alors 

1 if 1 

_— = re 
(1 — P{£ <> | Î Jo |-—. (3.24) 

T7 


De cette inégalité il s'ensuit en particulier que l’équicontinuité d’une famille 
de fonctions caractéristiques en 0 équivaut à la compacité faible de la 
famille correspondante de fonctions de répartition. 

2. Pour tous les f réels on a l'inégalité 


0  1—Re (21) = 4(1- Re f(r)). (3.25) 
3. Sil/(r)l = © < 1 pour |r| > € > 0, alors pour || < & 
O1 «1-1 È r', (3.26) 


4. La fonction caractéristique f(f) d'une variable aléatoire bornée 
£ de module |£| < cet de variance 0? vérifie les inégalités 


1 
: LU 
e7*" <|f(t)|<e * | pour eZ. (3.27) 


6l 


5. La fonction caractéristique /(#) d'une variable aléatoire de densité 
bornée p{x) = c et de variance finie vérifie les inégalités 


[f(r)] << exp {- 4} pour |] >" ; (3.28) 
LS 
ET» 
3 «3.7. Fonctions caractéristiques de lois à plusieurs dimensions. Soit 
Et = (E, Es, ..., &) un vecteur aléatoire à valeurs dans un espace eucli- 

dien R", de fonction de répartition F(x) = P{Ë, < xs, Ës < x2,...,4, < x, 
x = Gi Xe rs Ye) ERA. 
La fonction caractéristique du vecteur aléatoire £ est définie par 


(0) = Eetf = Île" ar (3.30) 
RAA 


[f (0) = exp {- } pour tous les s. (3.29) 


LL 
où 1= (fut ..., 1,4), (x = Ÿ thx est le produit scalaire des vecteurs 
=] 


tet x. à 

Les fonctions caractéristiques des lois à plusieurs dimensions possèdent 
les mêmes propriétés que les fonctions caractéristiques de variables aléa- 
toires aux différences près suivantes. On appelle moments du vecteur 
aléatoire £ = (£,, &., ..., &,) les nombres 


LU ES is E(ETES &). G.31) 
Le nombre k = k,+K3+ ... +k, s'appelle ordre du moment. Les moments 
à indices entiers peuvent être déterminés par dérivation de la fonction 
caractéristique 
C0) (3.32) 
Ori O1... O1 lo 


Exemple 1. La loi normale à deux dimensions est définie par 
la densité de probabilité 


Ma RE — 


ag Ya) = 
[2 7 =2@-08), @—b) | 
ed || 


O2 0} 


1 
= ———,; CXp 
270,03 V1—x1 rs 24-71) 


La fonction caractéristique est : 
fx 12) = exp {iar, + bts (oë2+ 2on0rfita+ oirp)}. 
Les paramètres de cette loi admettent l'interprétation suivante : 


2 r = E(£ ê2) 


a— Ef,; b=Eé,;; of=Ei; oi = Ei; O0 
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Exemple 2. La loi normale à plusieurs dimensions est définie 
par la densité 


PÂXu .5 Xn) = da {-7 ot Xa cs x)}, 


OÙ Q(X 1 Nas 5 Ne) = D b,, (x: — 42) (x, — a,) est une forme définie posi- 


k, 
tive. D = detB,B={b,,1<k,r<n} La fonction caractéristique 
correspondante est de la forme 


Slas las cos ln) = CXP {iat-+ tor'}, 


où la matrice des moments d'ordre deux o = {o4, 1 <i</j<«n) est 
définie par les relations o = B-!; 0, = E£éé,. 


Chapitre 4 
THÉORÈME LIMITE CENTRAL 


En théorie des probabilités, le terme théorème limite central désigne toute 
proposition affirmant que sous certaines conditions la fonction de réparti- 
tion d’une somme de variables aléatoires individuellement petites converge 
vers la fonction de répartition d’une loi normale lorsque croît le nombre de 
termes. Le théorème limite central doit son importance exceptionnelle 
à l'explication théorique qu'il fournit de l'observation suivante, confirmée 
du reste par la pratique : si l'issue d’une expérience aléatoire est définie 
par un grand nombre de facteurs aléatoires, chacun d'eux exerçant une 
influence arbitrairement petite, cette expérience se laisse bien approximer 
par une loi normale d'espérance mathématique et de variance convenable- 
ment choisies. 


4,1. Théorème limite central pour une suite 
de variables aléatoires indépendantes 


4,1.1. Théorème limite central dans le cas de variances finies. Soit 
{E£,, kæ 1} une suite de variables aléatoires deux à deux indépendantes 
de fonctions de répartition G,(x) = P{Ë, < x} d'espérances mathémati- 


ques EË, = a, et de variances Var &, = of finies, de plus B?= Ÿ° oj!> 0 
k=]1 


pour n> |. 


On appelle somme normée des variables aléatoires &,, E:,...,6, la 
quantité aléatoire 


7 = B;\ À (Ëx— 0) 


telle que Er, = 0, Var 7, = 1 pour tout n> 1. 
Soit F,(x) la fonction de répartition d’une somme normée 7,, D(x) = 


e * dz la fonction de répartition de la*loi normale réduite. 


| 
É A/27 
Si les variances sont finies, le théorème limite central définit les condi- 
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tions sous lesquelles 
1 f -+ 
lim F(M=@d)=—— le * dz (1.1 
Jim_ F0) = 90) = = | ) 


uniformément en x € ]— co, œf. 


L'une des formes les plus simples du théorème limite central qui 
apparaît le plus souvent, notamment dans les applications de statistique, 
est rattachée à une suite de variables aléatoires identiquement réparties. 


Théorème de Lévy-Lindeberg. S/ {£,, k = 1} est une suite de variables 
aléatoires deux à deux indépendantes PRE réparties, la fonction 
—na 
de répartition F,(x) de la somme normée 1, = 7 vérifie la relation 
aA/n 


(1.1). 
Le théorème suivant est un cas particulier important du théorème de Lévy- 
Lindeberg formulé pour des variables aléatoires binomiales £,. 


Théorème limite central de Moivre-Laplace (théorème intégral de 
Moivre-Laplace). Si », est le nombre d'apparitions d'un événement de 
probabilité p, 0 < p < 1, dans une suite de n épreuves indépendantes, alors 
la fonction de répartition F,(x)*de l'écart normé par rapport au nombre 


= p 
moyen 7, = mn ‘d'apparitions de cet événement vérifie larelation (1.1). 


V/np(-p) 
Exemple 1. On demande d'évaluer la probabilité que l'écart 


entre la fréquence . de l'apparition d'un événement dans une suite 


d'épreuves de Bernoulli et la probabilité p, 0 < p = 1, de cet événement soit 
< €, Où € est un nombre positif quelconque. 


Pa _ = pl" 7 PRE LS PeE 
{f-r|<e) e| | V5) 
ne V5) 7 ( V7) j 
n 
-F(-e Va ) | 


n 


P(i —p) 
3 — 26002 65 


Sieet n sont tels que € æ<x, où x est un nombre (fixé) fini, 


alors le théorème intégral de Moivre-Laplace nous dit que 


efe-r<d ee (4/5) 
-0(-41/ 75) - 2 [ e ? dz. 
V2 


Si les valeurs de #, p et e sont connues, on calcule le second membre à 
l'aide des tables de la fonction de répartition de la loi normale. 

Si les variables aléatoires ne sont pas identiquement réparties l'une 
des principales raisons qui fait que la fonction de répartition F,(x) de la 
somme normée 7, ne peut converger vers la fonction de répartition d’une 
loi normale est liée aux diverses contributions des termes de la somme 7, 
et au fait que ces termes ne jouent pas le même rôle dans cette somme. Une 


. . . — 
condition assurant la «petitesse uniforme » des termes ee dans r, 
L ] 


est la condition de petitesse uniforme 


lim max Æ=0. (1.2) 
1—+0 l1eiægn A 


Cependant cette condition n'est pas suffisante à la réalisation du théorème 
limite central. L'exemple suivant le montre. 


Soient P{£, = 0} — 1, P{é, = +k1} = _ k 
| 


72 La relation (1.1) n'est pas réalisée pour la 


somme ”,., puisque 7, > 0 presque sûrement en raison de la convergence 
presque sûre de la série ÿ &,. Ceci résulte de 
=! 


On a Ef,=0, 


Varé=1,7,= 


À, P{Ën 0) ä À F Ter 


donc, d'après le théorème de Borel-Cantelli, seul un nombre fini de varia- 
bles &, sont presque sûrement différentes de zéro. 
Les conditions suffisantes les plus faciles à vérifier sont exprimées dans 
le théorème suivant. 
me de Liapounov. Si pour une suite de variables aléatoires 
{£ss kæ 1} deux à deux indépendantes il existe un nombre à > 0 tel que 


1 € j 
ons B3*9 2 Eli al" a d, 
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alors la fonction de répartition F,(x) de la somme normée n, = 
ÿ (£a) 
a vérifie la relation (1.1). 


La condition (1.3) est dite condition de Liapounor. 
La relation (1.1) et la condition de Liapounov sont suffisantes pour que 


| 
lim [ [x [?+0 dE = 7 uns Tdx= 


[ | x [249 dD(x). (1.4) 


Si la convergence vers la fonction de répartition (1.1) est assurée et si 
la relation (1.4) est réalisée, la condition de Liapounov est une condition 
nécessaire pour qu'on ait une petitesse uniforme au sens (1.2). 

Exemple 2. Supposons que des variables aléatoires &, sont deux 
à deux indépendantes et réparties selon la 1 


P{b= +4) = + 


On a alors E£, = 0, Var &, = of = k. 
Gus sn +1)(2n +1), 
Be = ÿ 3 OR 


n _ & : n'(n+ 1)? 
EP=k, DEP De 


Donc 


lim 1 pr À E|é,[° = lim #. = et 


et la condition de Liapounov est réalisée. 
D'après le théorème de Liapounov 


lim PAÉ de x 4/0) 
. ; 1 _« 
= lim PURÉE D(x) = Va Î e ? dz. 
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La condition la plus générale assurant la réalisation du théorème 
limite central pour des suites de variables aléatoires {£,, k = 1} possédant 
des variances finies est la condition de Lindeberg : pour tout € > 0 


._ 1e 
Isa] es 


où G,(x) sont les fonctions de répartition des variables £,. 

Théorème de Lindeberg-Feller. Soit {£,, k 1} une suite de variables 
aléatoires deux à deux indépendantes. La condition de Lindeberg est une 
condition nécessaire et suffisante pour que soient réalisées la relation (1.1) 
pour la fonction de répartition F,{x) de la somme normée 1, = 


$ (Ë,—@) 
= - et la condition de petitesse: uniforme (1.2). 


La condition de Liapounov est suffisante à la réalisation de la condi- 
tion de Lindeberg ainsi qu'il résulte de l'inégalité 


1 © 1 1 © 
HA J Gad r Ê ElR-ai 
Ir-el>e8, 


4.1.2. Conditions générales de convergence vers une loi normale pour les 
suites de variables aléatoires indépendantes. Soient {&,, k = 1} une suite 
de variables aléatoires deux à deux indépendantes de fonctions de réparti- 


tion G,(x) = P{é, < x} et n,= F > E,—a,, où {«,} et {B, — 0} sont 


des suites de constantes. 

Si l’on n’admet pas que les moments sont finis, il peut exister des 
suites de constantes {a,} et {B, — 0} telles que la relation (1.1) ait tout de 
même lieu pour la fonction de répartition F,(x) = P{n, < x}. 

Théorème. Soient £, des variables aléatoires identiquement réparties, 
G(x) = P{é,; < x}. Une condition nécessaire et suffisante pour qu'il existe 
des suites de constantes {«,} et {B, — 0} telles que la fonction de répartition 
FX) = P{n, = x} vérifie la relation (1.1) est que 


P{l£|=x) _ 
z—> 00 Î z? dG(2) 


fs] <z 


0. (1.5) 


La condition (1.5) est équivalente à la suivante : la fonction d(x) = 
= [ z*dG(z) est lentement variable, c'est-à-dire pour tout c > 0 

ls] <= 
lim d(cx) = 


do 
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Soit E{" une variable aléatoire tronquée (en w,), c'est-à-dire 


. fé si lalæe. 
We j re 


où {p,} est une suite de constantes positives, p, > oo. 


Ona 
E{=— [ zdG(); 
[sl<gn 
Var &{" = f z'dG(z) — ( f ed) : SA 
lsrl<çgn [sl < ga 


Les quantités E&{ et Var £ qui existent pour toutes les variables 
aléatoires sont appelées respectivement espérance mathématique et variance 
tronquées (en y,). Les égalités (1.6) expliquent le sens des constantes nor- 
malisées et centrées B, et «, : 

| n 


= Var 9: «= ) En. 
bs À # B, 2 | 
Il est d'usage de dire que si existent des suites de constantes (an) 
et {P, — 0} telles que la fonction de répartition F,(x) de la variable aléa- 


toire 7, => £,-«,, où £, admettent une même fonction de réparti- 


tion G(x), converge vers une fonction de répartition F(x), alors G(x) tend 
vers F(x) ou bien G{x) appartient au domaine d'attraction de F(x). 

La condition (1.5) est une condition nécessaire et suffisante pour que 
la loi définie par la fonction de répartition G(x) converge vers une loi 
normale. Les problèmes généraux liés à la description de toutes les lois 
limites possibles pour », sont traités dans le chapitre 5. 

Exemple 3. Supposons que des variables aléatoires £, possèdent 
la densité de probabilité 


_ 
ro» | Éd 
0, [x] < 1. 


La variance des variables aléatoires possédant une telle densité est infinie. 
Cependant le moment tronqué (en x = 1) d'ordre deux 


Inlxk, [xl=1; 


NZ dz=21nx 


dx) = Î z'g(z) dz = sf 
DÉE 


est une fonction lentement variable. Donc 


LES : 
ain 


Théorème. Soient &,, k > 1, des variables aléatoires deux à deux indé- 
pendantes, G,(x) leurs fonctions de répartition. Pour qu'il existe des suites 
de constantes {«,} et {B, — 0} telles que soit réalisée la condition de petitesse 
uniforme im max P{Ié,1 >ef,}=0 pour tout e 0 et qu'ait lieu la 
relation (1.1) pour la fonction de répartition F,(x) de la variable aléatoire 


| L] 
M = Z— 2, 6e 4 
" B, À . 
il est nécessaire et suffisant qu'existe une suîte de constantes 7, y, > 
pour n—+ co, telle que 


Ÿ [ dG(-0; 


kel ]z] æ 7x 


LE f D [ Min | ms 


xl < yn ialæyn 
Si une telle suite existe, pour «, et B? on peut prendre les sommes des 
espérances mathématiques et des variances tronquées, plus exactement 


i= i | [_wacto-( f rat) |: 


ant la <ys al < ÿn 


I n 
A, — Ps 2 Î x dG (x). 


Isl<ys 


4.1.3, Théorème limite central dans le schéma des séries. On appelle schéma 
des séries une double suite de variables aléatoires {6,, 1=k<k,, 
K,—0c, n> 1} dans laquelle les variables aléatoires £,1, a, ..., ênes 


formant la n-ième série sont deux à deux indépendantes pour tout ”. 
Le schéma de sommation des séries est un cas particulier du schéma des 
séries. Ainsi dans le cas de variances finies, la #-ième série s'écrit £,,, 


RP E - où Pr SES 


SR © à 
LI 
V/È Var &, 
k=1 


Forme générale du théorème limite central dans le schéma des séries. 
Soient {En, 1<k<k,,næ1} un schéma de séries, Fax) et F,(x) les 
& 


Là 
fonctions de répartition des variables aléatoires £,, et E, = 2 £a respective- 
| 


ment. 
Pour que lim F,(x) = (x) uniformément en x E ]—c, of et que 


soit réalisée la condition de petitesse uniforme 
lim max P{lé,|æe}=0 (1.7) 
y 


= —+ co sie 
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our tout & > 0 fixe, il est nécessaire et suffisant que 
k 
lim Ÿ P{léulæe)=0; 
n—>00 k=]1 


ln 
im XD  [ xdFux)=0; (1.8) 


n—+00 kel |z| < € 


lim à | f st4Fat9- ( (| 220) ET 


n—> 00 k=l Izsl<e 2l<e 


4,2. Théorème limite central pour les vecteurs 
aléatoires indépendants 


4.2.1. Analogue multidimensionnel du théorème intégral de Moivre-Laplace. 
Considérons une suite d'épreuves indépendantes, donnant chacune lieu 
à m événements 4,, ..., 4. de probabilités p,, Ps, ..., Ps 0 < Pi < 1. 
Soient v, (5) le nombre FRE de l'événement 4, dans une suite 

VC) — np; 


pi (l — Ps) 
moyen d'apparition de l'événement A, dans la suite de x épreuves, 7, = 
= (7,(1), 7,2), ...,7.(m)) le vecteur des écarts normés dont les compo- 
santes sont généralement des variables aléatoires dépendantes, 


F, (x) = EX: ACPREET Xn) = P{7,(1) << Nyse. 7, (011) < XX}. 
Théorème. 


de n épreuves, n,(5) = l'écart normé par rapport au nombre 


1 ° 
lim Ex ÉÉSRRRRE — —— ( és | CXPp{ ——X 

n —> 00 : .) 4/7)" det C 2 

X ÿ va] dzidz3 ... dzn, (2.1) 
LA js1 
où C={cy, i, j = 1, ..., m} est la matrice des covariances du vecteur », ; 
Liz, 
y = Er), QD) = V PiP; 


_A-?)(-p))' ia 
q 


CET Gp). Up 


{1 


71 


c{; est le (i, j)-ième élément de la matrice C7" et, de plus, 


(—p;)(P:+ 9) NN, 
q 


ARE a. 
q : | 


4,2,2. Analogucs multidimensionnels des théorèmes de Lévy-Lindeberg ct 
de Lindeberg-Feller. Soient {Ex = (67,...,67), n=1, 2, ...} une suite 
de vecteurs aléatoires deux à deux indépendants, d’ espérances mathémati- 
ques EË, = a, et de matrices des covariances C, = cov &, = E[£,—a,]x 
X{É, — a,}° (le symbole * désignant le transposé du vecteur colonne [é,—a,)), 


B, = » C, la matrice des covariances de la somme vs &,et Bi!? sa racine 


carrée. Si la matrice B, est définie positive, le vecteur 7, = B;1? ÿ (Ë,— a;) 
mi 


cst appelé somme normée des vecteurs aléatoires &,, ...,£,. Le vecteur 
mn, est caractérisé par le fait que E7, = 0 (le vecteur nul) et cov 7, = 
= En,7, = 1 (la £XkK-matrice unité). 

Désignons par F(x) = F,x:1, Xe, ..., X4) la fonction de répartition 
de la somme normée 7, : 


EX, ACTE X4) = P{ri < jo ÿ: <= Nos oo, nr < En 


où »f est la /-ème composante du vecteur »,, et soit ®,, , (x) une loi normale 
k-dimensionnelle d'espérance mathématique nulle et de matrice des co- 
variances unité. 

Théorème. Si {£,,n> 1} est une suite de vecteurs aléatoires deux 
à deux indépendants identiquement répartis, EË, = a, cov £, = C et la 
matrice des covariances C est définie positive, alors ‘la fonction de répartition 


Ex) = FX, Xe, ..., X2) de la somme normée 1, = RC À (£,—-a) 
s1 


est telle que 
lim F,(x) = Do, 1 (x) (2.2) 
uniformément en x € RE, 


Si les vecteurs aléatoires £, ne sont pas identiquement répartis, on a le 
Théorème. Soient G (x) = G (x, ..., x) les fonctions de répartition 
des vecteurs aléatoires E Supposons que la matrice des covariances D, de 


Li] 
la somme D &, est définie positive pour tout n. Pour que la relation (2.2) et 
=1 


lim me _P{l&-all - 8eYTrB,} = 0, 


n—+>00 1=1! 
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où Tr B, est la trace de la matrice B,, aient lieu pour la fonction de réparti- 
n 

tion F,(x) de la somme normée n,:= B;" Ÿ (a), il est nécessaire et 
171 


suffisant que 


] 2 NN. == 
Mr À J _ Ik-altdG@=0  @2 
ze >e VTr2, 
(ceci est l’analogue multidimensionnel de la condition de Lindeberg) et 


im inf Box) 0, 


- 2.4 
sem Nxle E 


4,23. Théorème limite central pour les vecteurs aléatoires dans le schéma 
des séries. Soient Ex, Enz, ..., Eux, n = 1, 2, ..., une suite de séries de 
vecteurs aléatoires indépendants et identiquement répartis dans chaque 
série, à valeurs dans un espace euclidien à £ dimensions R', G, (x) les 
fonctions de répartition des vecteurs &,,, /= 1, Ç 

Théorème. Si existent un vecteur a € R et ‘une matrice symétrique 
définie positive B, tels que pour z € R'et e > 0 l’on ait 


lim &, [  (,2)G,(dx)= (za); 


A —+ 09 I|zil <e 
lim ke f (x) G(dx)- 
Mzrll<s 


lim &, [  G,(dx)=0, 
ñA —+ 00 Izll > 
£ 
alors la loi du vecteur aléatoire n, = > & converge faiblement pour n 
l=1 


vers une loi normale de fonction caractéristique 


g(z) = exp {ia D (Bz, 3}. (2.6) 


4.3, Théorèmes limites locaux 


4,3.1. Théorèmes limites locaux pour les densités. Soit {&,, k = 1} une 
suite de variables aléatoires deux à deux indépendantes de fonctions de 
répartition G,{x) = P{£é,< x} et telles qu’ à partir d’un #, la somme 


ÿ £, admet une densité de probabilité pour 72 ",. Sans restreindre la 
k=1 
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généralité, on peut admettre que #1, = 1. Les théorèmes limites locaux 
pour les densités expriment les conditions pour lesquelles les densités f(x) 
des sommes normées ou, dans le cas général, des sommes de la forme n, := 
= _. > E,—a,, les suites de constantes {«,} et {f, — 0} étant dûment 


n = 
choisies, vérifient la relation 
lim /,(x) = gx) (3.1) 


uniformément en x E ]—co, œ[, où gx) = st est la densité de 
] [ 4 Va 


probabilité de la loi normale réduite. 

1. Cas de variances finies. 

Théorème. Si dans une suite {£,, k æ 1} les variables aléatoires sont 
identiquement réparties, possèdent une espérance mathématique finie E£, = 
el une variance Var &, = o? et sif (x) est la densité de probabilité de la somme 

£,—na 
normée 7, = Léna , alors une condition nécessaire et sufisante pour 
a \/n 
que suit réalisée (3.1) est qu'il existe N tel que 


sup fy(x) < co. 


Si les variables aléatoires &, ne sont pas identiquement réparties, on 
définit une classe M, de suites de variables aléatoires {£,, k æ 1} d'espé- 
rances mathématiques finies EË, — a,, de variances of = Var &,, B1= 
= ) ot -0,n> 1, telle que parmi les fonctions de répartition G,(x) des 
variables aléatoires &,r au plus soient distinctes. 

Soit 1, k = 1, ..., r le nombre de fonctions de répartition de type 
k des n premiers termes de la suite {£,, £ = 1} de M,. 

Théorème. Si une suite de variables aléatoires {£,, k = 1} appartient à 
la classe M,, B,— pour nc, la densité f(x) de la somme normée 


= ——— existe et 
Tn B, 


. . LUS 
] min = ©, 3.2 
séoieierB ee 


alors une condition nécessaire et suffisante pour que la relation (3.1) ait 
lieu est qu'il existe un N tel que 


sup f#(x) < ©. 


II. Conditions générales de convergence vers 
la densité d'une loi normale. Appelons /,(x) la densité de 
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probabilité de la variable aléatoire 


où les variables aléatoires £, sont indépendantes et possèdent la même 
fonction de répartition G(x), {«,} et {P, = 0} sont des suites de constantes. 

Théorème. Pour qu'il existe des suites de constantes ja) et {B, > 0) 
telles que f(x) vérifie la relation (3.1), il est nécessaire et suffisant que soient 
réalisées les conditions suivantes : 

1) /a fonction de répartition G(x) converge vers celle d'une loi normale 
(n° 4.1.2) ; 

2) il'existe N tel que sup f,(x) < cs. 

æ 


4.3.2. Théorèmes locaux pour les lois réticulées. Soit {6,, 172 1} une 
suite de variables aléatoires deux à deux indépendantes, de même fonction 
de répartition G(x), c'est-à-dire (voir n° 1.4.3) les variables aléatoires &, 
prennent leurs valeurs sur une progression arithmétique {m1+kh}, h > 0, 
k=0, +1, +2,.... 

Supposons que les variables aléatoires £&, possèdent une espérance 
mathématique finie EË, = a, une variance Var &,= u* et que P,(r) — 


=P {ÿ = nm rh} : 


Théorème de Gnédenko. Une condition nécessaire et suflisante pour que 


lim sn Pr)-g(xs)| = 0 (3.3) 
uniformément en r(—©< r< co), q{x) = S he étant la densité de 


n(m—a)+rh 


oVu 


la loi normale réduite, x,, = , est que le pas h de la fonction 


de répartition G(x) soit maximal. 


En particulier, si les variables aléatoires &, sont binomiales, le 
théorème de Gnédenko se spécialise en le théorème local de Moivre- 
Laplace. Si la probabilité p d'apparition d'un événement est différente de 
0 ou de 1, la probabilité P,(r) que dans une série de n épreuves indépendantes 
cet événement soit réalisé r fois vérifie la relation (3.1) avec 


r—np 
TN p). 
Van 


Si l'on n'admet pas que les moments sont finis, on a le théorème 
suivant. 
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Théorème. Pour que des suites de constantes {x} et {f, > 0} vérifient 
uniformément en r(— >< r<co) la relation 


lim LE -P,(r)—g{x,.,) | = 0, (3.4) 
À — > nl 


— [l 
où g{x) est la densité de la loi normale réduite et x,, = nm bn + rh | 


# 
il est nécessaire et suffisant que soient réalisées les conditions suivantes : 
1) Ja fonction commune de répartition G(x) des variables aléatoires 
4 tend vers celle de la loi normale (numéro 1.2.1) ; 
2) le pas h de la fonction de répartition G(x) est maximal. 


4,4. Précision du théorème limite central 
et développements asymptotiques 


4.4.1. Inégalités d’Esseen et de Berry-Esseen. Soient {&,, k=1} une 
suite de variables aléatoires deux à deux indépendantes d'espérances 


mathématiques finies Eë, = a, et de variances Var &, = ofet B? = ÿ of > 0. 
k= 


Si l'on admet l'existence des moments d'ordre = 2, on peut établir non 
seulement la faible convergence de la fonction de répartition F,(x) de la 


ÿ (£x— a) 
somme normée 7, = = vers la fonction de répartition D(x) de 
la loi normale, mais aussi comment cette convergence a lieu. 
Théorème. Si pour un Ô << 1 positif existent E|£,-— a,l?+%, alors 
| n 
sup | F, (x) — (x) | « À 6 24 Elé,—a,|?+9, (4.1) 


où À est la constante absolue. Si à = 1, l'inégalité (4.1) s'appelle inégalité 
d’Esseen, En particulier, si des variables aléatoires &,, ...,&, sont identique- 
ment réparties et à = 1, l'inégalité (4.1) se spécialise en l'inégalité 


E|-af 


on 


sup |F,(x) — D(x) | = À (4.2) 


appelée inégalité de Berry-Esseen. 
Dans (4.1) et (4.2), les constantes absolues ne peuvent être inférieures 


1 . : 
à——. Dans l'inégalité de Berry-Esseen la plus petite valeur de la 
1/27 


constante À est ds 
sup Vi EJE, ap ‘UP | FCx) — 8(x) |, 
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où le premier sup est pris sur tous les n et toutes les fonctions de réparti- 
tion F,(x) pour lesquelles le moment d'ordre trois est fini et l'espérance 
mathématique nulle. La valeur exacte de cette constante n'est pas connue. 
Tout ce qu'on sait c'est que 


IE Fe. 
lim sup Sup VR — ——— | F(x)- (x) | = 

D'après les calculs actuels, : ce de la constante Ep n'excède 
pas 0,9051 dans l'inégalité (4.1) et 0,82 dans l'inégalité (4.2). L'inégalité 
de Berry-Esseen peut être renforcée ou modifiée de la façon suivante : 

E|é,-4{° 

où Vü(i +| x DL 

2) si oP(F,, À) est la distance de F,, à ® dans un cspace métrique 
L,(p = 1), c'est-à-dire 


1) |F,G)—2(x) | < 4 


1 
PCF, D) = Î 1 AG) - 00) fr al” 
alors 
E|é,-a{|° 
4h 


Il est impossible d'améliorer le degré des approximations dans (4.1) 
et (4.2) sans introduire d'hypothèses supplémentaires. 


QP(F,, D) = À 


4,4.2. Précisions du théorème limite central dans le cas multidimensionnel. 
Soit {6,, £ = 1} une suite de vecteurs aléatoires deux à deux indépendants, 
identiquement répartis, à valeurs dans R°, de vecteur des espérances mathé- 
matiques E é, = a et de matrice des covariances B = covëé, définie positive. 

Dans le cas multidimensionnel, l'inégalité de Berry-Esseen devient : 


si G,(x) est la fonction de répartition du vecteur 7 5 Av alors 


sup | CDD, » (| < 40 (à & ” e)> Jr 6 


où ®,, »(x) est la fonction de répartition de la loi normale de vecteur des 
espérances mathématiques 0 et de matrice des covariances B ; A(k) une 
ns ECTS dépendant uniquement de la dimension k; 
E A 
@ = (E| TAFAEEE [#2 , 
, le ème mineur principal de la matrice des covariances B. 
En particulier, pour k = 2 l'inégalité (4.3) s'écrit 


& la ième composante du vecteur &,: A= det B ; 


sup 16,90,» C1 40) EÉPE — 4 


FORTE 
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La majoration (4.4) n'a un sens que pour des valeurs de À assez éloignées 
_ Fe 1, c'est-à-dire la loi du vecteur &, doit être assez éloignée de la loi dégé- 
nérée. 


La majoration de la vitesse de convergence, qui est valable quelles que 
soient les hypothèses imposées à la nature de la dépendance des composan- 
tes du vecteur é,, est — 

& 
À (1 


sup, [G,(x) - De, 2 (x) | << BK) Va (4.5) 


où B{(k) est une constante dépendant uniquement de la dimension K. 


4.4.3, Développements asymptotiques pour les sommes de variables aléatoi- 
res, Dans le théorème limite central, les développements asymptotiques 
sont fondés sur le développement des fonctions suivant les polynômes de 


Tchébychev-Hermite 4, (x) 


= a 
HG) = (1er Le? ; 


= _ 
. (=D'ax 
FRE 5 k(m-2H)1 2 


& 


(4.6) 


où 51 est la partie entière de _ , 
Les premiers polynômes de Tchébychev-Hermite s'écrivent : 
H(x%)=1; H(d=x; H(d=xt-1; HN) = x -3x; 
H4(x) = xt-6x1+3; H{x) = x°—10x°+ 15x ; ... 
Désignons par y, le j-ième semi-invariant de la variable aléatoire &, et 
soit 


Vire hi, 4. 
11 kl Mr) Du 


QC = —e DE Hntu C9 Îl — : (4.8) 
4/2n 11 kil \U+2)! oiti 


où la sommation est étendue à toutes les racines entières positives de l'équa- 
tion k;, +2k: + +mk,=mets=kitkit... +k.. 

Théorème. Si des variables aléatoires AE 1, deux à deux indépendan- 
tes et identiquement réparties possèdent un moment absolu fini d'ordre 
ræ3,EË, = a, Var, = ot et vérifient la condition (C) de Cramer 


lim |g(z)| <1, (4.9) 


s—+ 


OX) = A F y Hn+2e-1(x) Il — 
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g(2) étant la fonction caractéristique de la loi G(x) = P{Ë, < x}, alors la 


5 é—na 


fonction de répartition F,(x) de la somme normée 1, = ———— est 


justiciable uniformément en x E ]— ©, [ du développement asymptotique 


r-2 
FE (x) = eut Ÿ M o[s : ] : (4.10) 


où ®(x) est la fonction de répartition de la loi normale, Q, (x) des polynômes 


(4.7). En particulier, si r=3etu,= f (x-a)"G(dx), alors 


Ex) = ®(x)+ 


a? 
Hs 1 7 1 
(—-x9——e +0 (>) : 
60° 4/n 4/27 4/n 
Le développement (4.10) admet diverses modifications et renforce- 
ments, notamment dans les hypothèses du théorème précédent 


CES 
20) = o(r i. (4.11) 


(+1x[) 1 F0) - (x) - -ÿ 20 VF 
_(r=3)» 
dx = er : |. (4.12) 


Pour tout p > = 


jI" 


Pour tout p> 1 


dl 


r+p—#t 


"éxto(r” . L: (4.13) 


1 
+0 Cas " : (4.14) 


eo 1 
où || (x) Il, = f f(x) 1? as)” ?, si la fonction f(x) vérifie la condition 


[ |) = O6) fr dx = fl se 


Pour tout p> I 


ILE, G)— 20), = 


Q, (x) 
DEA 


I=1 


[ If (x) dx <ce, 


19 


Théorème. Si des variables aléatoires &,, n > 1, deux à deux indépen- 
dantes et identiquement réparties, possèdent une loi réticulée à valeurs sur une 
progression arithmétique {m+hk}, h>0,k=0, +1, +2, ...,si le pas h 
est maximal, EË, = a, Var é, = 0? > 0 et si existe un moment absolu fini 
d'ordre r > 3, alors pour la fonction de répartition F,(x) de la somme normée 


ÿ £,—na 
Ta = Ge on a le développement asymptotique 
ox 4/n 
EG) = Be )+ Hal a) SE 
j "= 
L (T- FF) SL ®,,(x)+0 (, : ] (4.15) 
uniformément en x € ]— ©, œ[, où 
D,,(9 = 00)+ $ LE à 
d 1 sil= 4k+1 ou 4k+2 ; 
| -1s1=4k+3 ou 4k; 
sin 27/x 


co 2: 4 
Su (x) = 2 DHLQRE ee , Sau+ 1 (x) _ ?a 22 (apttt ÿ 


Théorème. Si des variables aléatoires &,, n æ 1, deux à deux indépendan- 
tes et identiquement réparties, possèdent un moment absolu fini d'ordre r > 3, 
Eë, = a, Varé, =0> 0 et la densité f(x) de la somme normée 7, = 


À &na 
= on 


X E ]— 00, cf le développement asymptotique 


est bornée pour n = N, alors on a uniformément en 


r—1 
AO =80+T 2 so ( | | | (4.16 
il 


où g{x) = — e* est la densité de la loi normale réduite, g{x) des 


polynômes (4.8). 

Théorème. Si des variables aléatoires &,, n > 1, deux àdeux indépendan- 
tes et identiquement réparties ne prennent que des valeurs entières, si le pas de 
la répartition est égal à 1 et si existe un moment absolu fini d'ordre r = 3, 
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alors on a le développement uniforme en k E]-, © 


o VRP) = gx) + > ve FETE 
k— 


où P,(Kk) = P{ÿ ) & = k} : VE = Ne : g{x) est la densité de la loi 
normale réduite, q, (x) des polynômes (4.8). 


4,5. Grands écarts 


4.5.1. Zones de convergence normale. Soit &,,£,,...,£,,... une suite 
de variables aléatoires deux à deux indépendantes et identiquement 
réparties. 


Si les variables aléatoires &, remplissent les conditions du théorème 
limite central (intégral), la convergence uniforme de la fonction de réparti- 
tion F,(x) de la somme normée 7, vers la fonction de répartition de la loi 
normale réduite ®(x) entraine la convergence de 


1—F, (x) F,(-— x) 


"1-0 > D(=x) re 


uniformément en x pris dans chaque intervalle fini. De façon analogue, si 
les variables aléatoires £, réalisent les conditions du théorème limite local 
pour . densités et /,(x) est la densité de probabilité de la somme normée 
7,, alors 


1, 1 (5.1) 


nes (5.2) 


uniformément en x pris dans chaque intervalle fini. Les relations (5.1) et 
(5.2) peuvent avoir lieu uniformément en x € [0, A(n)] ou [—A(n), 0], où 
A(n) est une fonction croissante tendant vers l'infini avec n. Ces intervalles 
sont appelés zones de convergence normale (resp. intégrale pour (5.1), locale 
pour (5.2)). L'exemple suivant donne une idée de la zone intégrale de con- 
vergence uniforme. 

Exemple. Supposons que les variables aléatoires £,, £:,..., 
£,, ... décrivent une suite d'épreuves indépendantes de Bernoulli. De 


FER 
1=F%=P 1) 21 > xf = 
Yuan 
= P {ÿ > xVnp( =p+np} 
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il s'ensuit que TS = 0 pour tous x > \/ LEP . Donc, la 


relation (5.1) peut être mise en défaut dans l'intervalle [0, o(n)]. 
Pour les zones de convergence normale, A(n) = 0(4/n). En particulier, 
les zones sont dites étroites si A(n) = o(*/n), et monomiales si A(n) = 


où 0<a= + est un nombre donné. 


4,5.2. Développements asymptotiques individuels dans le schéma des grands 
écarts. Supposons que les variables aléatoires &,, définies ci-dessus, véri- 
fient la condition de Cramer 


3h > 0 tel que E exp {h1é,1} <c, (5.3) 


qui exprime l'existence de tous les moments de &,. Dans ce cas, la zone de 
convergence normale, intégrale et locale (si existe une densité de probabilité 
bornée des variables aléatoires £&,) est une zone étroite. 

Désignons par / (z) la fonction caractéristique des variables aléatoires 
&, et soit y(z) = In / (2). Si la condition de Cramer (5.3) est remplie, y(2) 
est une fonction analytique au voisinage de 0. La relation y’(s) = zV/Varé, 
définit s comme une fonction analytique de la variable z pour z assez petit. 

La série entière À(z) = À,+2z1,+z? À5+ ..., définie par 


PAG) = 5-5 O+7 w'6), 


s'appelle série de Cramer. Si EË, = 0, alors 


__Pa0Ÿ—-3yi _ Ys0—10yy30+ 1573 
da = 2 0 10p 0 + 1598 


Me dia E 5109 Her 


ÿs 
310% 
où a? = Var ê, et y, est le i-ème semi-invariant de la variable aléatoire &,. 


Si la condition de Cramer (5.3) est réalisée pour x > 0 et x = 0(4/n), 
on a les relations 


= + FE 1(7)] (1+0() : | 
en cor [-(-5)] (+02). 


Si, de plus, les variables aléatoires £, possèdent une densité de pro- 
babilité f(x) continue et bornée sur la droite tout entière, on a les relations 
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(5.4) 


suivantes 


= ee A(oa)] (1+0(5)) : 
Be co [-4(-)] (+ 0() 


pour x > 1 et x = o(4/ñ). 

Les relations (5.4) et (5.5) sont individuelles, car la série de Cramer de 
À(2) est définie par tous les semi-invariants, donc de façon unique par la 
variable aléatoire correspondante. 


(5.5) 


4.5.3, Zones de convergence normale et développements asymptotiques. 
Soit p(n) une fonction positive tendant aussi lentement que l’on veut vers 


l'infini, 0 < à < — Pour que les zones [0, #“o{(n)] et [ — # p{n), 0] soient 
de convergence normale, il est nécessaire et suffisant que 


su 
Eexp E di <, (5.6) 


Pour & < + la condition (5.6) est nécessaire pour que les zones 
[0, ro%] et [— 7 p{n), 0] soient zones de convergence locale normale et 
02 Le ir: 
e(n) ou)" J° 


Soit EL sa < ce . Considérons la série numérique 


suffisante pour que le soient les zones [e. 


6 2 
1 1 3 1 n+i 1 
6° 4 10° 2 n+3° 7 2 (5.7) 
1 s+1 1 s+2 


et soit s tel que — 5+3 eu< ‘12: 


Pour que les zones [0, #* p{n)] et [ — #5 p(n), 0] soient zones de conver- 
gence normale (intégrale), il est nécessaire que soit réalisée la condition (5.6) 
et que tous les moments de &, jusqu’à l’ordre (s+ 3) compris soient confon- 
dus avec ceux de la loi normale réduite. Ces deux conditions sont suffisantes 


C2 (2 : 
pour que les zones [e. 5 et [2 o| soient zones de conver- 
gence normale (intégrale). 


Si les conditions (5.6) sont réalisées, dans la zone Le. on a 


re 
| 
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uniformément en x les relations suivantes 


1—F,(x) = (1 (x)] exp (= je ()} 


CR (5.8) 
FE x) = Œ(- x) exp {- a (=)} 


où ÀW)(z) est un intervalle de la série de Cramer de longueur s, s étant défini 
par la condition (5.7). Contrairement aux développements (5.4), les relations 
(5.8) sont générales, car elles sont valables pour les classes de variables aléa- 
toires vérifiant la condition (5.6) et ayant les mêmes intervalles de la série de 
Cramer de longueur s, c'est-à-dire les mêmes moments jusqu'à l'ordre s +3 
compris. 


Chapitre 5 
LOIS INDÉFINIMENT DIVISIBLES 


5,1. Sommes de variables aléatoires indépendantes 
et lois de ces sommes 


5.1.1. Produit de convolution de lois. Soient £, et £, deux variables aléatoires 
indépendantes à valeurs dans RÀ° ; y, 12, leurs lois de probabilité respecti- 
ves, c'est-à-dire des mesures définies sur les boréliens À de R* par : u,(4) = 
= P{£é,€ 4). La loi de probabilité de la somme &,+é£, qui, visiblement, est 
une variable aléatoire de R" est donnée alors par la mesure 


(n(A) = [ a(4—x) pfdx), 


où A—x = {y: y+xE A}. La mesure y est le produit de convolution des 
mesures {1 Ct 42. On peut encore l'écrire 


HA) = [[ midx) md). (1.1) 


z+r € 4 


Le produit de convolution de u,et u, est noté u,% ts. De (1.1) il est clair 
que le produit de convolution est commutatif : 1% Ma = Us. SOit 
Fix), x € R”, la fonction de répartition de la variable &,. La fonction de 
répartition de £,+£2: est donnée par 


F(x) = (| Ex —;) dF0)), 


F(x) est appelée produit de convolution de F,et F,et notéc F= F;xFs. 
L'existence de la densité de probabilité /,(x) des variables &, entraîne celle 
de la densité f'(x) de leur somme et, de plus, 


10 = [AG 5) 0) dy, 


f est appelée aussi produit de convolution de /,et f2. 
On remarquera qu’une condition suffisante d'existence de la densité de 
la somme &, + ê, est l'existence de la densité d’un seul terme. Si, par exemple, 


existe /,(x) alors 
SG) = [ AG») B(dy). 


Si Ex Ées +. & Sont des variables aléatoires indépendantes de R”, la 
loi y de leur somme & = £,+ ... +6, est définie par le produit de convolu- 
tion des lois y, des termes de cette somme 


BH = HiXKUaX% ... Xl 
où Hi Uak .. Ku = (ik ... ku-)%4n est défini par récurrence. 
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En se servant de la commutativité et de l'associativité de la somme de 
variables aléatoires, on vérifie sans peine que le produit de convolution 
jouit également de ces propriétés. 


5.1.2. Fonction caractéristique d’une somme de variables aléatoires. La loi 
d'une variable aléatoire est définie par sa fonction caractéristique, c'est-à- 
dire par la transformée de Fourier de la mesure correspondante. Il s'avère 
que la fonction caractéristique d’une somme de variables indépendantes 
s'exprime de façon simple au moyen des fonctions caractéristiques des ter- 
mes de cette somme. 

Théorème. Soient &,, £,, ..., &, des variables aléatoires indépendantes à 
valeurs dans R", f, = Ee“"*%, zE R", la fonction caractéristique de la 
variable &,, £ = Ei+ ... +8, f(2) = Ee"®, Alors f(2) = fi(2) ..… f2). 

Cette proposition est une conséquence du fait que l'espérance mathé- 
matique d’un produit de variables aléatoires indépendantes est égale au 
produit des espérances mathématiques des divers facteurs et du fait que les 
facteurs du second membre de l'égalité 


k 
eo = I[et" êp) 
j-1 


sont indépendants. 

Si l'on a affaire à des variables numériques, on peut établir une relation 
analogue pour les transformées de Laplace : si &,, j = 1,2, ...,k, sont 
des variables numériques positives indépendantes et Ê = E,+ ... +6, 


(A) = Ee”Ÿ}, (à) = Ee” À, alors g(à) = Il (A). 


Supposons que les variables ê ne prennent leurs valeurs que sur un 
réseau de nœuds entiers de R" (c'est-à-dire &, ont presque sûrement des 
coordonnées entières). Dans ce cas, il est préférable de considérer non pas 
les fonctions caractéristiques mais les fonctions génératrices 


h(z) = Ez%, 
où z = (z!,...,2*) est un point de C”, espace complexe de dimension mn, 


[z|=1et z = IG}, xER",x= (xl, ...,x") (cf. n° 3.1). 


Désignons par A(z) la fonction génératrice de la variable à = 
= + ... +6, Alors A(z) = h(z) ... h(2). 


5.1.3. Exemples. 1. Soient &, et £, des variables aléatoires indépendantes 
gaussiennes dans R”, E£, = a,, B, la matrice de corrélation de &,. La fonc- 
tion caractéristique de #, est 


A) = exp fit, a) (Bz, 2)}. 
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Si f'(z) est la fonction caractéristique de la variable &, +£;, alors 
: | 
J@) = exp {it a+an—-> (Bi+ 8, 2)}. 


Donc, ë,+£, admet aussi une loi de Gauss d'espérance mathématique 
a,+4, et de matrice de corrélation B, + B:. 

2. Soient &, et £, des variables aléatoires poissonniennes indépendantes 
de paramètres a, et a, respectivement. Leurs fonctions caractéristiques sont 


fAQ) = exp {a(e“—1)}. 
La fonction caractéristique de leur somme est 
SG) = exp {(a1+ as) (e“—1)}. 


Leur somme est aussi une variable poissonnienne de paramètre a, + az. 


5.2. Définition et propriétés fondamentales 
des lois indéfiniment divisibles 


5.2.1. Définition. On dit qu'une loi de probabilité # dans R” est indéfini- 
ment divisible si pour tout # on peut exhiber une loi u,, telle que y se re- 
présente par le n-uple produit de convolution de y, 


H= RUE Un 
D 


n fois 


Une variable £ admet donc une loi indéfiniment divisible si pour tout » 
existent des variables aléatoires &,1, és, ..., &. indépendantes identique- 
ment réparties telles que 

£ = nt .…. +Ënn 


On peut définir une loi indéfiniment divisible en termes de fonctions carac- 
téristiques. Soit g(z), z € R”, la fonction caractéristique de la loi y: : 


g{z) = Jet (dx). 


Si x est indéfiniment divisible, pour tout n existe une fonction caractéris- 
tique p,(z) telle que 
g(2) = p,(z)". 


Les fonctions caractéristiques des lois indéfiniment divisibles sont dites 
fonctions caractéristiques indéfiniment divisibles. Indiquons quelques-unes 
de leurs propriétés fondamentales. 
I. Une fonction caractéristique indéfiniment divisible ne s'annule jamais. 
IL. arg (2) peut toujours être considéré comme une fonction continue. 
III. S7 pour t > 0 on définit 


pa) = (2) l'exp {it arg p(z)}, 
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où arg qg(z) est une fonction continue, alors g{(z)' est pour tous les t > O une 
fonction caractéristique indéfiniment divisible. 


5.2.2. Forme générale des fonctions caractéristiques indéfiniment divisibles. 
Pour toute fonction caractéristique indéfiniment divisible q(z) dans R", on 
peut exhiber : 
DaeR"; 
2) un opérateur linéaire positif de B dans R" ; 
3) une mesure finie IT sur les boréliens de R” pour laquelle II({0}) = 
tels que l’on ait 


gta) = exp {ita, 2-2 08e, + [ (eur {6 2.) LHlif 


I+lxË) D 0x : 


(2.1) 


où [x| = 4/(x, x). Si ZI = 0, g{z) est fonction caractéristique d’une loi de 
Gauss. La formule (2.1) donne l'expression canonique d'une fonction indé- 
finiment divisible. Les trois éléments a, B et ZI sont définis de façon unique 
par la fonction caractéristique. Indiquons un théorème de convergence des 
fonctions indéfiniment divisibles. 

Théorème. Une suite de fonctions indéfiniment divisibles ne peut conver- 
ger que vers une fonction indéfiniment divisible. Si @,(z) sont définies par la 
formule (2.1) dans laquelle on substitue a,, B,, IT, respectivement à a, B et II, 
alors p{z) converge vers g{z) définie par la formule (2.1) si et seulement si 
sont remplies les conditions : 

a) pour toute fonction continue bornée g{x) sur R", telle que g(0) = O on a 


lim fg(x) Z1,(dx) = | gx) (ax) ; 


b)_ lim (Az, 2)+ Ge pp (dx) = (Bz, 2)+ [® GT yyçax) : 


c) ira. a, = a. 

Le nombre des éléments déterminants peut être réduit jusqu’à deux 
pour les fonctions caractéristiques dans R!'. Pour toute fonction indéfini- 
ment divisible g{z) dans R!, il existe y € R'et une fonction G(x), G(— ) = 0, 
bornée continue à droite croissante, tels que 


zx 1+x° 
— t ex _ | — 
g{z) = exp {iz+ [ (e 1 ms) à pe 1 
izx ) 1+ x° 
1+x?7 x 
z? 
continuité à x = 0 est égal à = En dimension un, la représentation 


(2.2) est dite canonique aussi : ses éléments y et G sont définis de façon 
unique par la fonction caractéristique. Du théorème il s'ensuit qu'une 
condition nécessaire et suffisante de convergence de la suite de fonctions 


dG()}. (2.2) 


Ceci étant, l'intégrant (es-1- qui est prolongeable par 
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caractéristiques g,(z) représentables par la formule (2.2) dans laquelle », et 
G, sont substitués respectivement à y et G, vers la fonction y{z) définie par 
(2.2), est que 


a)y, y; 
b) G (x) — G(x) pour presque tous les x et G,(+ ©) > G(+ co). 
Indiquons encore quelques formules pour les fonctions caractéristiques 
indéfiniment divisibles en dimension un. Au lieu de la formule (2.2) on se 
sert de la formule 
0 


: ._ bz? ie _izx 
g(z) = exp Pet + Î (e —1- ee) dN(x)+ 


+ ] (eu = re) ao} (2.3) 


où yER!, b=>0, N(x) et Mx) ne décroissent pas respectivement 
sur ]— co, O[ et ]0, cf, M(— 00) = 0, M+0c0) = 0 ct 
0 1 
[xt dN(x)+ [ xtdM(x) < 00. 
—1 0 
La fonction caractéristique d’une loi indéfiniment divisible dans R! de 
variance finie peut être représentée par la formule de Kolmogorov 


qe) = exp {oz+ ( (e"=—1—izx) L dK co}, (2.4) 


où (x) est une fonction bornée continue à droite croissante telle que 
K(— ©) = 0, l'intégrant qui est prolongeable en continuité à x = 0 est 
2 
égal à _—. 
Si une variable £ cest négative et admet une loi indéfiniment divisible, sa 
fonction caractéristique est de la forme 


g{z) = exp ef (e“=— D'aMG)} (2.5) 
0 


où y > 0 ct M(x) cest une fonction croissante telle que A(+) = 0, 
L 
f x dM(x) = ©. 

Si une variable £ admet une loi arithmétique indéfiniment divisible de 
pas À, sa fonction caractéristique est de la forme 


g{z) = exp loss > (et — ne} (2.6) 


où net k sont des entiers, C, = 0, ÿ'C, < co. 


5.2.3. Exemples de lois et de fonctions caractéristiques indéfiniment 
divisibles 


I. Lol _. Poisson. £ admet une loi arithmétique de pas 1 définie par 
PÉ =Kk}= ET , kæ0. La fonction caractéristique est de la forme 


g{z) = exp {a(e“—1)}, (2.7) 


c'est-à-dire est DIE ei par la formule (2.6) avec h = 1, n = 0, 
Ci=a CG: =0,k#1 

II. Loi générale de Poisson. Soient £;, £e, ..., une suite de variables 
aléatoires indépendantes identiquement réparties ayant une loi # dans R”, 
y une variable aléatoire indépendante des précédentes et prenant des valeurs 


entières positives. Posons s, = 0, s, = > &,. La variable £ = s, admet alors 


une loi générale de Poisson. Si u"° désigne le n-uple produit de convolu- 
tion de la mesure x, 4° la loi d’une variable presque sûrement nulle, alors 


P{É € A} = D TE pr (4), (2.8) 
0 


où a est le paramètre de la loi de Poisson figurant dans la formule (2.7). 
La fonction caractéristique de la variable £ a pour expression 


7) = exp {a [ (e“s—1) u(dx)}, (2.9) 
c'est-à-dire peut être représentée ee : formule (2.1) avec une mesure 77 
définie par l'égalité J1(4) = Jr re AG»), B= 0, ct a€ R® tel que 


_f GG» 
(a, 2) mn 1+1|x|? (dx). 

III. Loi normale. On obtient la fonction caractéristique de cette loi 
dans R° en faisant 77 = O dans la formule (2.1), et en dimension un en 
faisant G(x) = 0 pour x < 0 et G(x) = G(0) pour x = 0 dans la formule 
(2.2). 

IV. La loi gamma est définie dans R! par la densité 


Pa(x) = ©" 7, X>0, px) =0, +x<0 («=> oO). 


La fonction caractéristique de cette loi est 


Pa(z) = Q=ix = XP {je FS EL (2.10) 


| 
1+ x? 


et se représente par la formule (2.3) avec y = « Î e”*dx, b=0, 
0 


NX) = 0, MG = - Ï _. dy. 


V. Lois stables. On appelle ainsi une famille de lois dans R! dont les 
fonctions caractéristiques sont définies par 
g{z) = exp {iyz-C|zl*(1+1Ba{z, «))}, (2.11) 
où 
ELA 


VER, C0, IBl<I, 0<a<l, oz, &) = sign z 18 > 


œ, 
2 
a #1, «fz, 1) = = In (2). 

Une loi stable est normale pour « = 2. Pour «x <= 2 la fonction ca- 
ractéristique de la loi stable peut être représentée par la formule (2.3) si 
l'on y fait b = 0, N(x) = ones M(X) =. oùC,>0,C:=—0 
sont des constantes. Il n'existe pas de formules explicites pour les densités 


des lois stables sauf pour les cas suivants : 1) « = 5 B=+1;2)æ=1, 
B=0; 3)x= 2. Pour « = à ,B=1,7y = 0, la densité s'écrit 
ci 


Ces 
Xe *, 


P(x) = 


pour « = 1, ff = 0, y = 0 on obtient une loi de Cauchy de densité 


E 
PN) 1040) : 
Toutes les lois stables admettent une densité qu'on peut calculer à l’aide 
de la formule d'inversion, puisque g(z) est absolument intégrable. 
Signalons une propriété inhérente aux fonctions de répartition des lois 
stables. F est une fonction de répartition d'une loi stable si pour tous 
a, > 0,4, — 0 et b, et b, existent a => 0 et b tels que 


(autrement dit, le produit de convolution de fonctions de répartition de 
même type est une fonction de répartition de ce type). On se sert parfois de 


cette propriété pour déterminer une classe de lois stables et ensuite déduire la 
formule (2.11) pour les fonctions caractéristiques. 
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5,3. Théorèmes limites pour le schéma des séries 


5.3.1. Théorèmes généraux. Soit une suite de séries de variables aléatoires 
RTS Eu, (le premier indice indique le numéro de la série, le second, le 
numéro de la variable dans la série), à valeurs dans R" et indépendantes 
dans chaque série. On dit que ces variables sont négligeables à la limite (ou 
infiniment petites) si pour tout s = Oona 


lim sup P{lé,,| > €} = 


n —+ < En 
Dans ce numéro on formule les conditions pour lesquelles les sommes 
£a 
= 2 ên de variables négligeables à la limite admettent une loi limite. 


Le Re fait important établi ici se formule ainsi : si /a loi limite des 
variables €, existe, elle est automatiquement indéfiniment divisible. 

En utilisant ce fait, on ramène le problème général des lois limites pour 
des sommes de variables aléatoires indépendantes au suivant : trouver les 
conditions qu'il faut imposer aux lois des divers termes des sommes &, 
pour que celles-ci admettent pour loi limite une loi indéfiniment divisible 
donnée. 

Désignons par #,, la loi de la variable &,, dans R° et définissons un 
a, € R® tel que pour tous les z € R" l'on ait 


(x, 2) 
1+(x, » 


Munissons R" d'une mesure 77, telle que pour toute fonction g(x) con- 
tinue bornée on ait 


(a, z) — 


) li (dx). 


[X — ay 


| 80) dx) = Ÿ | gecau) 
ar 


Théorème 1. Pour qu'une suite v, de lois des variables £, converge faible- 
ment vers une loi indéfiniment divisible de fonction caractéristique g{z) définie 
par (2.1), il est nécessaire et suffisant que soient réalisées les conditions suivan- 
tes : 


I CASE 


kn 
a) lim D'a=a; 


AN —+ oo Jj=i 


La 
b)lim Jim 5  f (ras, 2) (dx) —(Bz, 2)| = 
eo n—>00|J=1l |s]<e 


c) pour toute fonction g(x) continue bornée 


lim Ê [e(x)— 8009] 77, (4x) = [ Lex) — 800) IT(dx). 
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Remarque 1. Si seules les conditions b) et c) du théorème sont satfsfaites, 
Xn 
la loi de &,—a,, où a, = > a, converge vers une loi indéfiniment divisible, 


=! 
dont la fonction caractéristique g{z) est donnée par la formule (2.1) avec 
a = 0. Inversement, si pour une certaine collection de vecteurs a, € R" 
la variable &Ê,—a, admet une loi limite de fonction caractéristique (2.1), 
alors les conditions b) et c) du théorème sont remplies et 


ln 
lim (Ÿ ay | = a. 
no \j=1 

Les conditions de convergence sont plus simples pour les variables 
aléatoires à valeurs dans R!. Soit F,,(x) la fonction de répartition de la 


variable &,,, 


Ant Î = dF,tx), 
À 2? 
GD= [2e dora. 


Théorème 2. Pour qu'une suite F,(x) de fonctions de répartition de 
variables &, converge faiblement vers une fonction de répartition limite, il est 
nécessaire et suffisant que soient satisfaites les conditions suivantes : 


kb 
a) il'existe lim Days=7}; 
n —+ © f—1 
b) /a suite de fonctions G,(x) converge faiblement vers une fonction 
croissante G(x). Si ces deux conditions sont remplies, la fonction caractéris- 


tique de la loi limite est donnée par la formule (2.2). 
k 


Remarque 2. Si la condition b) est remplie, la variable &,— Ÿ a,, admet 
1 


J 
une loi limite dont la fonction caractéristique est définie par la formule (2.2) 
avec y = 0. 


5.3.2. Application des théorèmes généraux. Utilisons ces résultats généraux 
pour formuler des conditions de convergence vers des lois indéfiniment 
divisibles concrètes. 

I. Conditions de convergence vers la loi dégénérée. Soft donnée une 
suite de séries de variables aléatoires &,,, ..., &,,, à valeurs dans R, indé- 


pendantes dans chaque série. Pour qu'il existe une suite de vecteurs a, € R® 
telle que pour tout e > 0 


lim P{Ié,-a,l > 8} = 0, 


n —> © 
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ka 
où 4, = D Em (c'est-à-dire &,—a, + 0 stochastiquement), il est nécessaire 
1 


et suffisant que soient réalisées les conditions suivantes : 


Le 
a) À ay—-4 +0; 


[x — a,,l* : 
lim D [se ne Titan 4x) = 0 


N —+ œ 


(les notations sont celles du théorème 1 ). 
IT. Conditions de convergence vers la loi normale. Pour qu'une suite 
E, admette une loi normale limite dans R*, de fonction caractéristique 


g(2) = exp {ia D (Bz, 2)}, 


j est nécessaire et suffisant que 
, n 
a) lim ÿ'as=a; 
mn —+ 60 j=i 


b) pour tous les e > 0 


_lim Ÿ PIE! > e} = 


—+ 00 j=l 


c) pour une = 0 


J=1 |r]<s 


lim CG z)— Ÿ f (x-a,s, 2)? dax) = (0. 


IT. Conditions de convergence vers la loi générale de Poisson. Une 
suite &, admet une loi — de Poisson limite si 


a) existe lim : P{É, # 0) = 


mn —+ 


b) existe une mesure v(dx) sur R" telle que pour toute fonction g{x) 
continue et bornée sur R* l'on ait 


La 
lim} fletx)-80)] autdx) = [ [g(x) —8(0)] sax). 
j=1 


8 —+ © 


Si ces conditions sont remplies, la fonction caractéristique de la loi 
limite est donnée par 


g@) = exp {f Cet» 1) »{dx)}. 
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IV. Conditions de convergence vers la loi arithmétique. Soient £,, 
des variables à valeurs entières. Pour que &, admette une loi limite, il est 
nécessaire et suffisant que : 


k, 
a) existe lim ÿ P{£, #0} = C 
ñ —+ co j=i 
b) pour tout entier m existe 


ls 
lim D'P{y=m}=c, 


A —+> f=1 
et C= Y C,.. Si ces conditions sont satisfaites, la fonction caractéristique 


CL.) 
de la loi limite est 


g{z) = exp{-C+S Che") = exp {5 Ce!" — 1}. 


Remarque. Si dans la condition b) on pose C,, = 0 pour m # 1 on 
obtient des conditions de convergence vers la loi de Poisson. 


5.4, Théorèmes limites pour les sommes croissantes dans R! 


5.4.1. Théorème pour les sommes croissantes. Considérons une suite de 
variables aléatoires indépendantes £,, £,, ..., £,, ... dans R'et posons 
les problèmes suivants : quelles sont les conditions d'existence de constantes 
A, ct B, telles que les variables 


En = . ( &-4.) (4.1) 


admettent une loi limite ; comment choisir les constantes 4, et B, ; quelle 
sera cette loi limite ? Ce problème se ramène à la sommation de variables 
dans le schéma des séries si l’on pose 


= _. (£a), (4.2) 


où a sont tels que È ax = À,. Il s'avère que si les variables (4.2) sont 


négligeables à la limite SOU un certain choix de a,.,, elles le seront aussi si 
l'on pose au = mm, Où m, est la médiane de la variable £,, c'est-à-dire un 


nombre tel que P{é, > m,) > JE , PH<m)> 5: Les constantes 
B, doivent être choisies telles qu'existe la limite finie non nulle 
(x — a)! 
Him È inf Er ap A+) (4.3) 
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où la fonction F;(x) est la fonction de répartition de la variable &,. Une fois 
B, choisis, on peut prendre 


AS » [+ B. Î a dx +m)]. (4.4) 


Théorème 1. Si pour une suite donnée Ë, on peut choisir B, tel que soit 
réalisée la condition (4.3) et, de plus, pour tout & > 0 
lim P{lé;-ml > eB,} = 0, 
ñn —+ © 
alors pour que }, admettent une loi limite il est nécessaire et suffisant que 


soient satisfaites les conditions suivantes : il existe une fonction croissante 
G(x) telle que G(— >) = 0, G(+c) < et pour presque tous les y 


CE. PA 
: : x? 
ALU à Î Bi+x? dFifxtim+as) = GG), 
el 
im à Î non dF,(x À. nt as) — G(+ co), 
où 


ft x 
Lx — B, Î Bi+xt dF,(x + mi). 


Si cette condition est remplie, la fonction caractéristique de la loi limite 
est définie par la formule (2.2) avecy = 0. 

A noter que si les conditions du théorème 1 sont remplies, pour loi 
limite de &, on ne peut pas prendre n'importe quelle loi indéfiniment di- 
visible, mais une certaine classe de ces lois dite classe Z. 

Les lois de la classe Z sont telles que la fonction G de la formule (2.2) 
admet obligatoirement en tout point x # 0 une dérivée à gauche et une à 
droite et la fonction 

1+x? 


X 


n'est croissante ni pour x < 0 ni pour x = 0 (ceci étant, G’(x) peut désigner 
n'importe quelle dérivée à gauche ou à droite, éventuellement pas la même 
dans les divers points). Si l’on utilise la représentation (2.3) des fonctions 
caractéristiques de lois indéfiniment divisibles, alors la classe L est con- 
fondue avec l'ensemble des lois pour lesquelles les fonctions N et M de 
(2.3) sont logarithmiquement convexes, c'est-à-dire M(—e”*) et M{(e*) sont 
convexes (la première vers le bas, la seconde, vers le haut). Les lois stables 
(y compris les lois normales) sont de la classe Z. 
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G(x) 


5.4.2. Application du théorème général. 
I. Convergence vers la loi dégénérée. Il est clair qu’en choisissant les 
constantes B, à croissance assez rapide on peut faire en sorte que £, converge 


stochastiquement vers 0. Ce fait ne présente pas d'intérêt si . — 0. 
Si cette ee n'est pas remplie, on peut exhiber des constantes CL 
telles que & | > £,;—1 converge stochastiquement vers 0. Dans ce cas les 
constantes C. “caractérisent dans un certain sens la croissance des sommes 
aléatoires ÿ &, qui sont alors appelées relativement stables. 

Sippnsons que les constantes À, et B, sont choisies d'après les formules 
(4.3) et (4.4). Si lim An = 0, alors pour tout & = 0 


Pr à 
lim P{ 
A —+ © 


Voici une autre condition de stabilité relative. Supposons qu'existent 
des constantes C, telles que 


ÿ4-1|>e}-0 (4.5) 


An 


1) lim YP{ll>C)=0 
km] 


2) si FN) est la fonction de répartition de la variable &,, alors 
On 


lim 7 [+40 - 


RO En]! 
— Can 


Sous ces conditions, la relation (4.5) est réalisée si l'on pose 


a Cn 
> (| \dF(x) 
1 eo, 


Supposons maintenant que les variables £, sont identiquement réparties 
et sont positives, P{£, > 0} > 0. Pour que les sommes &, soient relativement 
stables, il est nécessaire et suffisant que 


lim XdF(x) = + © 


4 —> 00 MF | 


(si 1—F(t9) = 0 pour un f,, on convient que _ = + oo, C > 0, de sorte 


que cette condition est remplie). Les constantes 4, telles que la relation 


7 — 26002 97 


On 
(4.5) ait lieu peuvent être prises égales à 4, = n [ xdF(x), si C, sont tels 
0 


que to! et Jim 1 n(1—F(C)) = 0. 

Exemple. Supposons que les variables £, prennent les valeurs 
2" (n = 0, 1, 2, ...) avec la probabilité _ (le gain au jeu de quitte ou 
double). Alors 2* << f < 2»+t1 


xdF(x) = S n —+ + oo. 


1 
1(1—F()] J 


Si l’on prend 4, = n In n, la relation (4.5) sera réalisée. C, peut être pris 


égal à n 4/In n par exemple. 

II. Convergence vers la loi normale. Soit £, une suite de variables 
aléatoires indépendantes de fonctions de répartition F,(x). Sans restreindre 
la généralité, on peut admettre que leurs médianes m1, = 0 (autrement on 
considère les variables £, — m,). 

Pour qu'ilexiste des constantes À, et B, telles que 


che 


admette une loi normale limite pour n + « et que pour tout e = 0 
lim P{Ié,1 > eB,} = 0 
"M —+ 


il'est nécessaire et suffisant qu'existent des constantes C, telles que 


1) lim ) > P{Iil > Ca) = 0 


2) lim a; D : | du | [ dr) | pes 


{xl < On [x | < On 
Ceci étant , on peut poser 


2 
B, = sa | sans) |: 
ARS RAS 


AY [ xdf(x,. 


nt [a] < Ca 


La fonction caractéristique de la loi normale limite sera g(2) = e Fu 
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5.4,3. Théorèmes limites pour les termes identiquement répartis. Soient 
Er, Es -.., des variables aléatoires indépendantes identiquement réparties. 
Indiquons les conditions sous lesquelles existent des constantes 4, et B, 


telles que la variable 
1 Li 
C: nu B, (© ë-4.) 


admette une loi limite pour nr -> c. Dans ce numéro nous nous intéres- 
serons aux lois limites autres que les lois dégénérées et normales, puisque 
la convergence vers ces dernières a été étudiée antérieurement. Nous nous 
limiterons en outre au cas de variables dans R!. 

Théorème 2. Si les variables £, admettent une loi limite, celle-ci est 
automatiquement stable. 

Pour formuler d’autres résultats, nous aurons besoin de la notion de 
fonction régulièrement variable. Une fonction (1) définie pour # > 0 
(ou pour tous les # entiers — 0) est dite régulièrement variable si pour tous 
les £ — Oexiste 

h(s,) 


Ar.) 


pour f, +0, . — k. Il s'avère que cette limite (qui dépend naturelle- 


lim 


ment de £ seul) est obligatoirement de la forme k% (— © < & = + co), 
L'exposant « est appelé puissance de la fonction régulièrement variable. 
Pour « = 0 la fonction est dite lentement variable. Une fonction régulière 
de puissance « se représente par A(r) = 12h,(#), où h.(r) est une fonction 
lentement variable. 

Voici quelques exemples de fonctions lentement variables : 

a) la fonction h(r) pour laquelle lim (rt) existe et est différente de 0 ; 


t—+ © 
b) (1) = (log rŸ quel que soit B ; 
c) A(e) = [log log (+ 1) pour tous les B. 
La forme générale de la fonction lentement variable cst 


t 
h(t) = C(0) exp J L dz}, 


te 


où existent Jim C(G)#0et lim a«(z) = 0. 


1 + oo 8 —+ + © 
Les conditions de convergence vers des lois stables d'exposant « sont 
exprimées dans le 


Théorème 3. Pour qu'il existe des constantes À, et B, telles que les 
variables &, admettent une loi limite stable d'exposant à, il est nécessaire et 
suffisant que 

a) la fonction h{(t) = 1 - F(t)+ F(— 10) > 0) soit régulièrement variable, 
de puissance «(O < x < 2) ; 


7% 99 


b) existe lalimite 


 1—F() 
MO © 
Dans ces conditions la fonction caractéristique de la loi limite stable sera 
g() = exp {iyz-C1z|* (1+ iBa(z, «)}} (4.6) 


(cf. formule (2.11)), où y et C sont des constantes dépendant du choix de 
A, et B, ; « la puissance de la condition a) ; B = 21-—1, où À est celui de la 
condition b). 

On peut choisir les constantes B, indépendamment des valeurs de « et 
B, plus exactement telles que 


lim ”/(B,) = 1 (4.7) 


N —+ co 


(ceci est toujours possible en raison de la régularité de la fonction h). 
Pour choisir 4,, on distinguera trois cas. 
1. « = 1, 4, = 0. Si B, est choisi d’après (4.7), alors dans la formule 
(4.6) y = 0, C = "0-2 cos . « (l'est la fonction gamma). 
2. 1 < « < 2. Dans ce cas il existe EË, = a et À, = na. Avec un tel 


choix de 4, et B, on aura dans (4.6) y = 0, C = — 


a(x— 1) . 
3. « = 1. Dans ce cas on peut prendre 4, = nB, Eee: + dF(x) 
(B, sont définis à partir Le (4.7)). Pour un tel choix des constantes 4, et B, 


on aura C = CH du J Fat 
n°2 ass] 


Chapitre 6 
LOIS DE PROBABILITÉ CLASSIQUES 


On décrit plus bas les lois de probabilité les plus importantes. 


6.1. Lois discrètes 


6.1.1. Loi dégénérée. 1. Une variable aléatoire £ admet une loi dégénérée 
concentrée en a si 
P{=a)}= 1. 


La fonction de répartition est : 
| 0, v<a; 
FN) = 


1, NN a. 


2. La fonction caractéristique : g(r) = e!'*. 

Les moments : Eft = at ; Var ë = 0. 

3. La loi dégénérée décrit des variables non aléatoires. Réciproquement, 
si une variable aléatoire £ admet une espérance mathématique finie et une 
variance nulle, alors 

P{£ = Eé} = 1. 


6.1.2. Loi de Bernoulli. 1. Une variable aléatoire £ est bernoullienne, de 
paramètre p (0 — p = 1)si 


P{—1}=p, P(£=0}=1-p. 


La fonction de répartition est 


0, x<0; 
FW=S1-p, 0<x<l|; 
1, x> |. 


2. La fonction caractéristique : g(1) = 1-+p{e"-— 1). 

Les moments : EËt = p ; Var £ = p(1-p). 

3. La loi de Bernoulli joue un rôle fondamental en théorie des probabili- 
tés et en statistique, car elle sert de modèle à toute expérience aléatoire dont 
les issues appartiennent à deux classes mutue'lement exlusives. 


6.1.3. Lol binomaile. 1. Une variable aléatoire £ est binomiale de para- 
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mètres (nr, p)(0<p<il,n> 1)si 
PH = k} = Cipi(i-py"!t, k=0,1,...,n 
La fonction de répartition est 


î 
D Chpli-p}rt,  l<x<141; 
FO = Cr 
1, NN; 


0, x < 0. 

2. La fonction caractéristique : g(1) = {1+p(e“!—1)}". 

Les moments : ES = np, EE? = np+n(n- 1)p!, EË = np{1 + 3(n— 1)p + 
+(u—1)(1-2)p°], EËt = np{l+7(n-— 1)p +6(n—1)(n—2)pt+(n—1)(n—-2)X 
X(1— 3)p°], 

Le coefficient d'asymétrie : y = a 
V/np(1 — p) 

Les moments centrés y, = E(Ë — Ef}t peuvent être calculés à partir de 
a formule 


dyi 
lan = PA —P) [réa - 1 #l 


3. La loi binomiale est un modèle de n épreuves homogènes indépendan- 
tes de Bernoulli : si &,, k — 1, ..., n, sont des variables indépendantes 


CJ 
bernoulliennes de paramètre p, la variable aléatoire £ — D &, est binomiale. 


: l n 
, t = EE : 
4. Si p est tel que "m1 —-p) — 9 et PAT < p < nil on peut se 


servir des formules d’approximation D 2 


N— np 
B(n,k)— PE = k}& —-— (= =), 
É 75 Vup(i = p) 
= 
où g(x) = = e ? est la densité de probabilité de la loi normale 
réduite, ou 


B,(n, k) = (— ] AE 0,5 +) 


/npQ = p) Var p}}" 
où (x) — [a (u) du — = | e ? du est la fonction de répartition 
Mi 


- © 


— 
de la loi normale réduite. 
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Pour les mêmes valeurs de p la fonction de répartition F(x) est justicia- 
ble de l'approximation 
x+0,5— æ) 


FD = oS | 
‘ V np(l — p) 


3 
Si np? > 1,07, en se servant de la fonction de répartition de la loi normale 
au lieu de celle de la loi binomiale, on commet une erreur == 0,05 pour tous 
les x. 


à à 1 
Si p est du même ordre de grandeur que : pour les grands #, ou 


p <= 0,1, on peut utiliser l'approximation par la loi de Poisson 
8,0, = Cl e-w, FU) = >. CET er 


Soit F,s(x) la fonction de répartition de la loi bêta*) de paramètres « et fi. 


On a alors 

PÉ =<k)= F_s2#a-p). 
Si nu, CSt une variable aléatoire admettant unc loi de Snédécor à 
(1, m2) degrés de liberté, alors 


Kkt+11-p 
EG) = PE A) = P{-pire 0 ET 5. 


6.1.4. Loi binomiale négative (lol de Pascal). 
1. Une variable aléatoire £ est une variable de Pascal, de paramètres 


(r, p} si°®) 
P{S = k}=cC Te PL p}, k — 0, Le 


2. La fonction caractéristique est : 


_ P É 
Li ere" 
rip) ; Var £ — =) | 


Les moments : EË — 

3. Si r est naturel, la loi de Pascal décrit le nombre d'épreuves de Ber- 
noulli nécessaires pour obtenir la valeur 1 très exactement r fois. 

Si des variables aléatoires &,, &# = 0, 1, 2, ..., sont indépendantes et 


C4 
admettent une loi logarithmique, la variable aléatoire £ — 2 E,, où r est 
k=0 


°) Voir définition à la page 115. 
°e) Sir n'est pas entier 

4 (r+k—1)(r+k—2) ...r 

Crgh-o———— —- RE 
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une variable de Poisson ne dépendant pas de &, et de paramètre /, est une 


variable de Pascal de paramètre r = DT x 


Voici encore une caractéristique de la loi de Pascal. Soit 7 une É o 


aléatoire de Poisson de paramètre y, c'est-à-dire P{y = k} = a e”#. 


On traitera y: comme une variable aléatoire admettant une loi gamma de 


paramètre À — er ct « = r. On a alors 


P{n = k} = C32-1PQ -p}. 


Dans cette interprétation la loi de Pascal trouve des applications en 
statistique des accidents et des maladies dans les problèmes liés au nombre 
d'individus d’une espèce dans les échantillons de populations biologiques, 
etc. 

4. Si p est fixe, la loi de Pascal est indéfiniment divisible. 


6.1.5. Loi géométrique. On dit qu’une variable aléatoire £ admet une loi 
géométrique de paramètre {0 = p = 1)si 


P{E = k} = p(1-p}, k = 0,1,2, ... 
2. Sa fonction caractéristique est : : 


0 ae 1-1 ph" 


Ses moments : 1 is A En 
P p° 


3. Cette loi est un cas particulier de la loi de Pascal avec 7 = 1. Elle 
décrit le nombre d'épreuves de Bernoulli nécessaires pour obtenir la valeur 
1 exactement une fois. 

4. La loi géométrique est importante par sa propriété dite d’absence 
de postaction : pour tout »n1, n > 0 


PL = m+n/£ = m}) = P(È > n}. 
6.1.6. Loi hypergéométrique. 1. Une variable aléatoire £ admet une loi 
hypergéométrique de paramètres (N, p, n) (0 < p < 1)si 
5 _k 
PH>k)= Cri», K=—0,...,n. 
CY 


2. Sa fonction caractéristique cest : 
co = (ND à LNpl net 
— Ntn) 0 (NI —p})-n+/}" TE 
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où C= C(C-1)(C-2)...(C—-/+10). La fonction g(r) est solution de 
l'équation différentielle 


(1 — et) (Tr C4 Np) SE + Npnp) — Npnp + NÉE = 0. 


L np{1 — P). 


3. Voici un problème classique faisant intervenir la loi hypergéométrique: 
on contrôle un lot de pièces comprenant Np bonnes pièces et N(1—p) à 
mettre au rebut. On tire n pièces au hasard. Le nombre des pièces défectueu- 
ses est donné par la loi hypergéométrique. 
4. Si nest petit en regard de N (en pratique # < 0,1N) alors 


Les moments : EË = np; Varë = = 


ChnCY-p) k —k 
Er Cip'(-p}"*. 


6.1.7. Loi de Polya. 1. Une variable aléatoire £ est de Polya de para- 
mètres (N, p, n, s) si 


P{E = k} = ça E+S) .(b+(k—Dslc(c+s) ...(c+(n-Kk— Ds] 
NON+Ss) ... [N+(u-1)s] 


où b = Np, c = N(1—p). 


n+P+1+ 
2. Les moments sont : Ef = np, E£? — DP —— ; 
++ 
ns 
+7 
Var £ = np({1-p) + 
1+7% 


3. La loi de Polya décrit des expériences de la nature suivante : on 
dispose d'une urne contenant Wp boules blanches et N(1 — p) boules noires. 
On tire au hasard une boule puis on la replace dans l’urne avec s nouvelles 
boules de même couleur. La variable Ë désigne le nombre de tirages d’une 
boule blanche dans une série de x tirages. Cette loi est largement utilisée 
pour la simulation des épidémies. 

4. Si nest petit en regard de N, alors 


P{É = k} ss Cip(i—p}-t. 


6.1.8. Loi de Poisson. 1. Une variable aléatoire £ est de Poisson de 
paramètre À(A = O)si 


P{£ — k= ea, k=0,1,2,::;: 
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2. La fonction caractéristique a pour expression : (1) = cle" — 1). 

Les moments sont : EË — À, Eë? — À°+ À; Var£ = 1. 

Les moments centrés y, = E(f — Eë}* peuvent être calculés à partir des 
relations : 


“ dita 
lu = À > Chat OÙ ss = Kit À D 
10 


3. La loi de Poisson peut servir à decrire le nombre aléatoire d'appari- 
tions de certains événements durant un intervalle de temps fixe, dans un 
domaine donné de l’espace. F 

4. Si np — À, alors Ckpt(1 —p}""* — al e-À., Pour les grands À on a 
l'approximation 

PL <E)% of), 
4/3 


où (x) est la fonction de répartition de la loi normale. 


Si F(x) cst la fonction de répartition de la loi de 7? avec 1 degrés de 
liberté, alors 


PE < k) = 1 Fr 2). 


Si £ est une variable de Poisson de paramètre 2, alors pour les grands 
À la variable 4/£ admet unc loi voisine de la normale et de paramètres 


| 
(V3 4 } 
S. La loi de Poisson est indéfiniment divisible. Si une somme de varia- 


bles aléatoires indépendantes est de Poisson, chaque terme de cette somme 
cest de Poisson. 


_ Soient &,,5s, ... une suite de variables aléatoires indépendantes 
identiquement réparties, » une variable aléatoire de Poisson de paramètre /. 


LA 
La loi de la variable aléatoire £ — Ÿ° £, est dite loi composée de 
&=1 


Poisson, 
La fonction caractéristique de la variable aléatoire Ë cst 


q{t) E e-Ativn 
où y{r) est la fonction caractéristique des variables aléatoires &. 


6.1.9. Lol binomiale générale. 1. Une variable aléatoire £ admet une réparti- 
tion binomiale générale de paramètres (#,p;, pa, ..., p,) (0 < p, < 1, 
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i=1,...,n)si 
{1 
n n k 
. 1 — . k= 1, EDS he 
P{È = k} = 2 2 2 pa IL, n 


on 


II Pi | UE | À 
1 
2. La fonction caractéristique a pour cxpression 


q) = Il [14 PC" D]. 


Les moments sont: Eë = Ÿ mn, Et = ) pt D Pam; Varë = 
CLE k=1 EU 


= È PAG — pr). 


3. Soient Ë,,ë., ...,#, des variables aléatoires indépendantes de 
Bernoulli, de paramètres p,, p+, ..., P, respectivement. La variable aléa- 


Li) 
toire Ë = ès ë, est binomiale générale. 


Si p = — rÈ P, A 0x = : 2 pi p° alors Var Ë == np(1 —p) -100,p. 
Donc, la nn de la loi binomiale de Pre (a, p) est de n variances 
de la variable aléatoire & à valeurs p,, k = 1, ..., n, ct de loi P{È = p,} = 


I | : nn: ; 
+ plus grande que la loi de la variable aléatoire binomiale générale £. 


6.1.10. Loi logarithmique. !. Une variable aléatoire £ admet une loi loga- 
rithmique de paramètre (0 < p = 1) si 


LU (1—p}t 


EL EN CNT E ve 
P{È = K&k)} PE =; 2 2 
2. La fonction caractéristique a pour expression gt) = 
Ù ï I-pt ip 
= in 5 NII -( net] = sel , na) 
Les moments s'écrivent : EË = —-———, Eët = — 1—p , EX - 
rl minp 

_(-p)C-p), — p 1—p 

: pinp Vars =- rl np] 
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3. La loi logarithmique est limite pour la loi de Pascal au sens suivant. 
Si », est une variable aléatoire de Pascal de paramètre (7, p), alors 


lim Pl, = k/n, > 0} =" "7", 


4. On appelle aussi logarithmique la loi de la variable aléatoire £ 
telle que 


P{E = k} = log, (k+1)-log, k, k=1,...,m-—I1. 


6.1.11. Loi de Borel-Tanner. 1. Une variable aléatoire £ est de Borel- 
Tanner de paramètres (r, «&) (0 = &« = 1) si 


HE Fe: 


ki-r-lo-akgk-r k = r, r+ 1, .…. 


. . | ARE a . = Er 

2. Les moments ont pour expression : Eë 1 Var =: 

3. En théorie des files d'attente, la loi de Borel-Tanner est définie 
comme la loi des unités servies pendant la période d'occupation d'un 
système dont les instants d'arrivée forment un processus de Poisson de 


paramètre « et de durée de service constante, sachant que r unités sont en 
attente à l'instant initial. 


6.2. Lois continues 


6.2.1. Loi uniforme. 1. Une variable aléatoire £ admet une loi uniforme 
sur l'intervalle [a, b] (a < b) si*) 


1 = _— , \Cla, b], 
0, x 4 [a, b]. 
(CF. fig. 1). 
2. La fonction caractéristique a pour expression 


l e'® _ eits 


1O= Ga à 
| titi 
e. [4 à = ee p=—=- = 
Les on sont : EË Kxi ss K=1l:2;,:,.2 
__@-—a) 


°) Ici et dans la suite /(x) désigne la densité de probabilité de la variable aléatoire 
considérée. 
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3. Le changement de variable 7 = ia ramène cette loi à une loi 
uniforme sur l'intervalle {0, 1]. La loi uniforme est l’analogue continu 
des lois classiques décrivant des épreuves à issues équiprobables. 

4. L'erreur d’arrondi d’un nombre est décrite de façon satisfaisante 

| 1  ! 
par une loi uniforme sur l'intervalle [> » 3 |: 


FIG. !. Densité de la loi uniforme. 


Si une variable aléatoire & de fonction de répartition F,(x) admet une 
loi continue, la variable aléatoire £ = F,(4) admet alors une loi uniforme 
sur [0, 1]. Ceci explique le large emploi de la loi uniforme en simulation 
statistique (les méthodes de Monte-Carlo). 


6.2.2. Loi triangulaire (loi de Simpson). 1. Une variable aléatoire £ est 
une variable de Simpson sur l'intervalle [a, b] si 


2 
J(Xx) = Gp itb-2x x € [e, b]; 
0, x € (a, b]. 
(Cf. fig. 2). 
f(t) 
és 
b-a 
0 a gs b 
2 


FIC. 2. Densité de la loi triangulaire. 


2. La fonction caractéristique a pour expression: 


4 
. Er . RE +3 +3— 
Les ne sont : L nes le +0 
: a+b : Var ë = É=9 | 


2 
3. Si £, et &, sont des variables aléatoires uniformément réparties sur 


l'intervalle 5. 2 la variable aléatoire à = £,+£, est de Simpson. 


6.2.3. Loi exponentielle. 1. Une variable aléatoire £ admet une loi exponen- 


tielle de paramètre À = O si 
ler, x>0; 
re = | 0, r<0. 


(CF. fig. 3). 
f(x) 


0 
FIG. 3. Densité de la loi exponentielle. 


2. La fonction caractéristique a pour expression : g(#) = —. 


! 
Les moments sont : EËt — Fe; Var £ = He. 


3. Cette loi est l’analogue continu de la loi géométrique. Sa propriété 
d'absence de postaction : 
P{É > 1+5/£ > s} = P{E > 1) 


la rend essentielle en théorie des processus markoviens discontinus. 
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6.2.4. Lol hyperexponentielle, 1. Une variable aléatoire £ admet une loi 
hyperexponentielle de paramètres (m ; &œ1, 2, ...,@n : Di, As, ..., An), 


a À, > 0, À, % = I si 


fœ = À ae _*æ0; 
O, x <0. 
(Cf. fig. 4). 


f(x} 


m 
Ë æœ A; 
0 ZT 
FIG. 4. Densité de la loi hyperexponentielle. 
2. La fonction caractéristique est : g(r) = È 7 a 7 
= 


m m 2 
Les moments s'écrivent : E£t = » PL ; ; Varé=2 DE -(> ) 
171 


3. Soient les indicateurs aléatoires L, k "1; 2405 0 Te. Le variables 
aléatoires prenant la valeur O0 ou 1 et telles que P{Z, = 1} = «, 


P{y I, = 1} = 1. Si &, k = 1,...,m sont des variables aléatoires 

mi 

admettant une loi exponentielle de paramètres À, respectivement, la 

variable aléatoire £ = Ÿ° /,£, admet une loi hyperexponentielle de para- 
£E] 


mètres (m1, &i, a, ..., En 5 À - 5 Ame 


en Loi normale. 1. Une variable aléatoire £ est normale de paramètres 
m, 0°) Si 


(z-m)! 


fx) = 7 e 4", xE]-0c, œl. 


(Cf. fig. 5). 
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Pour la densité de la loi normale on se sert encore de la formule 
oz _ m)? 


fH=—<e  , 


A/71E 


où p = 0,4769 ... est solution de l'équation 


LE dx = x, 


f(x) 


0 m 
FIG. 5. Densité de la loi normale. 


et E = pe V/20 est défini à partir de la relation 
P{I£-m|l< E})= P{l£-m| > E} = 0,5 


et appelé écart moyen (ou stochastique). 
2. La fonction caractéristique a pour expression : 


gt) = exp {im}. 


Les moments sont: ny; = 0, He = 1°3° ... -(2k—1)0#, où 
ba = E(Ë-Eé), EË£ = m; Varë = o?. 

3. Le rôle fondamental de la normale s'explique par le fait que sous 
des hypothèses larges les sommes de variables aléatoires sont asympto- 
tiquement normales lorsque le nombre de termes croît. Ces hypothèses 
sont exprimées par le théorème limite central. 


Le changement de variable 7 = * = ramène cette loi à une loi 


normale de paramètre (0, 1) dite loi normale réduite caractérisée par la 
fonction de répartition 


z 


D(x) = — [+ dz. 
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: 1 + À 
Les valeurs de la fonction D,(x) :- VE e ? dz, qui cest reliée 
0 
: ] | 
à la fonction (x) par la relation ®(x) --: 3 +00), sont tabulées. 
Pour calculer (x) pour de petits x, on peut utiliser le développement 


dx) = 
LE PA Fu 
2 a ( 2-3 212.5 ] 


co 


1 
dd. (sp) | 
ou encore le rapport de Mills ÆR(x) = _ = Î e? . dy, qui 


— e— 


4/27e 


se décompose en la fraction continue 


Te x+ \v+ \+ PRE 


Une variable aléatoire normale prend avec une probabilité élevée 
des valeurs proches de son espérance mathématique, ce qui s'exprime par 
la règle des sigmas : 

0,3173..., k=1; 
P{I£-m|= ka} = 4 0,0455..., k=72; 
0,0027 ..., k = 3. 


La plus courante est la règle des trois sigmas. 


4. La loi normale est indéfiniment divisible. Si une somme de deux 
variables aléatoires indépendantes est normale, chacune de ces variables 
est normale. 

La loi normale est encore connue sous les noms de deuxième loi de 
papes loi de Laplace, loi de Gauss, loi de Laplace-Gauss, loi de Gauss- 

aplace. 


6.2.6. Loi gamma. 1. Une variable aléatoire £ admet une loi gamma de 
paramètres («, À) (x = 0, À > O)si ‘ 


a" a! A ‘ . 
SN) = Ta) (x) e ci Fe ° 
O, x = 0. 
(Cf. fig. 6). 
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: 2. : H\7e 
2. La fonction caractéristique a pour expression : g(1) = ( 1 - 1) : 
ï a(m+1)...(@œt+k-1 œ 
Les moments sont : Efît — ai HI ERE T9 s Vari = je 


3, La loi gamma est l'analogue continue de la loi de Pascal. Pour « = 1 


; . n | 
elle est confondue avec la loi exponentielle, pour « — 3? À = TZ » avec la 


f(x) f(x) 
0O<æ<!f 
Al œ=f 
x Z 
a) b) 
f(x) f(x) 
1<a<2 a>2 
OX. | 
æ-I a-] 
À ob) À  d) 


FIG. 6. Densité Je la loi gamma. 


loi de 7° à n degrés de liberté. Pour À = nys ct à = n la loi gamma s'appelle 
lot d'Erlang de paramètres (n, x). Elle caractérise alors la loi du temps 
écoulé avant l'apparition de # événements d’un processus de Poisson de 
paramètre y. On l'utilise en théorie de la fiabilité et en théorie des files 
d'attente. 

Pour n + , la loi d'Erlang tend vers une loi dégénérée. 

Pour « = m+1 et À = 1, la loi gamma s'appelle loi exponentielle de 
paramètre »#. La fonction de répartition est de la forme : 


F L m 1! 
(x) = l—-e DATE 


La loi gamma cst indéfiniment divisible pour À fixe. 
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6.2.7. Loi bêta. 1. Une variable aléatoire £ admet une loi bêta de para- 
mètres (&, B)(« — 0, A = O) si 

L(a+B) a—i{t _ — . 

10 = | Form Ut x€l0, 11: 

0, xé [0,1]. 


(Cf. fig. 7). 


r{t+8} 
T(P) 


T 


(œ=1, pe) ={) 


T 


d) 


FIG. 7. Densité de la loi bêta. 


2. La fonction caractéristique a pour expression : 


T(&+8) S GX  l'(a+k) 
HO= TT LH KT T@+B+k) 

a(a+1)...(«a+k—1) . 
GFDG@+P+D. .@+B+k-1) 
__ L(a+k)T(a+p). = ap 


 TOT@+B+R * @HB}@HPTD 
3. La loi bêta est par exemple la loi des statistiques ordonnées. 


Les moments s'écrivent : E£t — 
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Si, Én ..., &, Sont des variables aléatoires indépendantes uniformé- 
ment réparties sur l'intervalle (0, 1] et Écuy Écan +. Es les variables &,, 
k = 1,...,n rangées par ordre de croissance ( s'appelle estimateur 
ordonné d'ordre k), alors la densité de probabilité f(x) de l'estimateur 
£a, admet une loi bêta aveca=k,f=n-k+1. 

Pour « > 1, B = 1, la loi bêta est unimodale de mode au point 


Y= ns Si « = B = 1, la loi bêta est confondue avec la loi uni- 
forme sur l'intervalle [0, 1]. Pour 8 = «+1, la loi bêta s'appelle loi générale 
de l’arcsinus, pour « = B:= —, loi de l’arcsinus, 


6.2.8. Loi de Cauchy. 1. Une variable aléatoire £ est de Cauchy de para- 
mètres (æœ, À) (À — O0) si 


À 


JG) = 7 Ga 
(Cf. fig. 8). 


f(x) 


0 a 
F1G. 8. Densité de la loi de Cauchy. 
2. La fonction caractéristique a pour expression :  g{f) = 
= exp{iat—21|r|}. 
Les moments d'une variable aléatoire de Cauchy sont infinis. 


3. Le paramètre « est mode et valeur médiane. La loi de Cauchy est 
indéfiniment divisible. 


6.2.9. Loi de Laplace (loi exponentielle double). 1. Une variable aléatoire 
£ est de Laplace de paramètres («, À) (À > 0) si 


JR) = Le-ar-a, FEI Re 
(Cf. fig. 9). 
Meta 


2. La fonction caractéristique a pour expression : g(1) = EEE 


Les moments sont: Eë%+1=@#+1(2k+1)l, ES = or 
ue — 1) 
F2u=-DrAt 
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1 2 
+] CH); Vart= 


3. Soient &,, &, des variables aléatoires indépendantes admettant une 
loi exponentielle de paramètre 7. La variable aléatoire £ = £,—£,+« 
admet une loi de Laplace de paramètres («, À). Cette loi est une loi limite 
dans les schémas de sommation d’un nombre aléatoire de termes aléatoires. 


f(x) 


0 [a d U 


F1G. 9. Densité de la loi exponentielle double. 


6.2.10. Lui de #?. 1. Une variable aléatoire £ admet une loi de 7? à 
a degrés de liberté si 


—— Aer, x>0; 
SX) = Tr(% 
2 r( 5) 
O, x «0. 
(CF. fig. 10). 
7) 
2 
| 
0 2 di 
a) 
fx) 
U<a<2 


q 


FIG. 10. Densité de La loi du x. 
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2. La fonction caractéristique a pour expression : (1) = (1 —2it) : 

Les moments sont : EËt = a(a«+2)...{æ«+2(4—1)]; Varë = 2x, 
la = 82, pi, = 482x+ 120, ... . 

3. La loi de 7? connaît d'innombrables applications en théorie des 
probabilités et en statistique mathématique dans l'interprétation suivante. 

Soient &,, +, ..., &, des variables aléatoires indépendantes suivant 


la loi normale réduite. La variable aléatoire £ = Y &, admet la loi de #° 
é=1 


à n degrés de liberté. 

Si 7 = (Nu Nas... M) est un vecteur normal #-dimensionnel d'espé- 
rance mathématique m1 = (m1,, m1., ..., m,) et de matrice des covariances 
C={cyi,j = 1,...,n} non dégénérée, la variable aléatoire 


Ë = G@-m) Cm) = > Ci On — m4) Om), 
4, juil 


où * désigne l'opération de transposition, c! les éléments de la matrice C”!, 
une loi de z° à n degrés de liberté. 
Si £ cst une variable aléatoire admettant une loi de 7? à # degrés de 


liberté, la variable aléatoire 4/2£*—4/2n— 1 admet approximativement 
une loi normale réduite. 

4, Un critère de vérification de l'accord des données empiriques avec 
une hypothétique fonction de répartition F(x) cst fondé sur l'étude de 
l'estimateur de 7° de Pearson 


£ 


. (1, — pi) 
: À NP | 


où p, = F(xi)— Fri), Xo = — © < Xy < ... < x, = © est une partition 
arbitraire de l'intervalle ]—, [, n, le nombre d'observations sur l'inter- 
valle {x:_1, Xl. Si l'hypothèse est vraie, l’estimateur de y? de Pearson admet, 
lorsque n = Ÿ°n,-> ©, une loi de y® à k— 1 degrés de liberté et ne dépend 
pas de F(x). 

S. Sié,, 2, ..., €, sont des variables aléatoires indépendantes normales, 
de paramètres (m1,, a°), (12, a°), ..., (mi, 0°) respectivement, la loi de la 
variable aléatoire £ — _ ÿ £? s'appelle loi de x? non centrée à n degrés 

{=1 
de liberté et de paramètre de décentrage »1 = L m?. Pour Îles grandes 
(— 
valeurs du paramètre m la loi de 7° non centrée à n degrés de liberté 
est approximativement confondue avec une loi normale de paramètres 


(n+m, 4/2{n+2n)). 
Sous l'hypothèse que les probabilités théoriques (p;, ps, ..., pa) sont 
égales, l'estimateur de 7? de Pearson admet jasymptotiquement une loi 


LUS 


de 7° non centrée à & — 1 degrés de liberté ct de paramètre de décentrage : 


ee ———_—— 
. 


k rh 
m = D (Pr, Ps) 
(1 Pi 


6.2.11. Loi de 4%. 1. Une variable aléatoire £ admet unc loi de z à & (œ > 0) 
degrés de liberté si 


ri 


I 


—— xa-le 1, x => 0; 
JG) = À 7 'P(e 
2 r(5) 
0, x = 0. 
(Cf. fig. LD). 
f(x) 
0 n-I “ 


F1G. 11. Densité de la loi de 7. 


2. La fonction caractéristique a pour expression : 
CS . AU . 
LS GV2) (1 #). 
r'{ @ ] ézo ! 2 
2 


Les moments s'écrivent : Et = 


CT 


(5) 


3. Si &,,&., ...,&, sont des variables aléatoires normales réduites 


TG) = 


I 
R 


indépendantes, alors la variable £ — \/ > 7 admet une loi de zà n 
CE 
degrés de liberté. | 
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Pour # = 2, la loi de ; est parfois appelée loi de Reyleigh (de Reyleigh- 
Rice). 

Pour n = 3, la loi de 7 est appelée loi de Maxwell. Elle décrit alors 
la loi des vitesses des molécules de gaz. 


6.2.12. Loi ? de Student. 1. Une variable aléatoire Ë est de Student à « 
degrés de liberté (x = O0) si 


a+] a+ 
rs) mé. XE]— co, cœf. 


SX) = Var ( = 


(Cf. fig. 12). 


f(x) 


(4) 
F1G. 12. Densité de la loi de Student. 


2. La fonction caractéristique a pour expression : g{rf) = 
1a+1 
4/1 es e-vs {el 


n-1 
: 24 n—1-À . o 
MCE Dig j7 2, CAM Cure(2 Val rl) , Si n— 


= “+ est un entier. 


k 
Les moments s'écrivent : E£4-1 = 0, EË£X — RE , 
v*  r() 
2 
« 


2k <a: Var£=4{ «-2° CR 
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3. Si » et € sont des variables aléatoires indépendantes, » suivant la 
loi normale réduite, & la loi de 7? à n degrés de liberté, la variable 


Ë = 14/ F suit la loi de Student à # degrés de liberté. 


Le paramètre « est un nombre naturel dans de nombreuses applica- 
tions en statistique. Pour « = 1, la loi de Student est confondue avec 


celle de Cauchy. On a affaire à la loi de Student lorsqu'on vérifie l'hypothèse 
de la moyenne d’une population normalement répartie de variance incon- 
nue. 

La loi de Student tend asymptotiquement vers la loi normale réduite 
pour de grandes valeurs de «. On montre que la loi de Student à n = 
= 2k+1,k = 0, degrés de liberté est indéfiniment divisible. 


6.2.13. Loi F de Snédécor. 1. Une variable aléatoire £ admet une loi de 
Snédécor à (m,, nm.) degrés de liberté si 


DA) me " _; _mtss 
2 3 : 
JO = À tm MES x Gmtmx) 7, x>0; 
QUE 
O, x =<0 
(Cf. fig. 13). 
f(x) f(z) 
m,<2 
L 
{my 2)me m.>2 dé 0 
mi(m+2) 
FIG. 13. Densité de la loi de Snédécor. 
r(5t+4) r(s- nt 
2. Les moments sont : EE = "7", si 2k < ms, 


M) er (22 
r(5+) mr (>) 


2m2m+ n1: — 2) 


m (12 — 2}° (1112 — 4) nl à 


_ M : 
E£ — m2 3 > 2); Varëé 
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3. Si &, et &, sont des variables aléatoires indépendantes admettant 
une loi de 7° respectivement à mr, et »1, degrés de liberté, la variable aléa- 


toire Ë£ = pen admet une loi de Snédécor à 1, m,) degrés de liberté, 
2/Ma 


c'est pourquoi "1, est appelé nombre de degrés de liberté du numérateur, 
m, Celui du dénominateur. En particulier, si x,, X2, ..., x, est un échan- 


tillon d’une population normale de paramètres (@ 0°), Vis acces Ju, UN 
échantillon d'une population normale de paramètres (4, u?), la statistique 


mi Z GX 
Ma >, GT 


ue 2 À -__ | : 
RS D xs} = PR 5 3 admet une loi de Snédécor à (m1, —1,m:— 1) 


degrés de liberté. 
4. Si &, et &, sont des variables aléatoires indépendantes, £, ayant une 
loi de y? à m, degrés de liberté, £, une loi de 7? non centrée à m, ra es 
1/m) 
Este 
admet une loi non centrée à (7,, m1.) degrés de liberté et de paramètre de 
décentrage "1. 


de liberté et de paramètre de décentrage mn, alors la variable £ — 


6.2.14. Lol logarithmiquement normale (lognormale). 1. Une variable 
aléatoire £ admet une loi lognormale de paramètres (m1, v°) si 


l (In x 1)" 
= CXPpi — — 4, x—0; 
fu = Lx V2 2u® 

0, x =0. 


(Cf. fig. 14). 
2. Les moments sont: E4*=— exp {> ko | km} *  Vart- 


= e7t"{e 1]. 

3. Si n est une variable normale réduite, alors £ = exp {u®n+m)} 
admet une loi lognormale de paramètres (m1, 0°). 

Cette loi est très répandue en physique statistique, géologie statistique, 
statistique économique, biologie, etc. 

4. La loi lognormale est un cas particulier de la lui de Kapteyn de 
densité de probabilité 

: [G(x) — " 


SN) = L — ox | 00 
u \/27 20° 


dx 
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où G(x) est une fonction monotone différentiable. Si £ est une variable 
de Kapteyn de paramètres (m1, a°, G(x)), alors 7 = G(£) est une variable 
normale réduite. La loi de Kapteyn s'obtient par application du théorème 
limite central à une somme de la forme x,,, = x,+2z,8(x), où x, sont 


des variables aléatoires indépendantes, G(x) — [4 : 
f(x) fix) 
N #J 
0 en-0 0 m né 
FIG. 14. Densité do la loi lognormale. FIG. 15. Densité de la loi logistique. 


6.2.15. Loi logistique. 1. Une variable aléatoire £ admet une loi logistique 
de paramètres (1, o°) si 


7 exp me (—”)] 
f(x) = Lie = ee om) .:° 
34/1 EN EES MMEAN 
vi +ew | 73 | 


C0 4 


XE ]J— 0, oo, 


(Cf. fig. 15). 
2. La fonction caractéristique a pour expression : 


ge) = em (1 V3) r r(isi 22) 


Les moments sont : EË = m ; Var £ = n°, 

3. La fonction de répartition diffère très peu de celle de la loi normale 
et, comme cette dernière, est utilisée par exemple dans les recherches médico- 
biologiques pour l'analyse de l'effet des divers médicaments, poisons, etc. 


6.2.16. Loi de Pareto. 1. Une variable aléatoire £ admet une loi de Pareto 
de paramètres (vo, &) (œ = 0, x, = 0)si 


0, N <Æ Yo: 
(CF. fig. 16). 
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œ 
a—k 


2. Les moments sont : EË* = xà, k<a; Varë= 


& 
a ——— Ÿ . 
-le-ne-2*" 72: 
co, a = 2. 


3. La loi de Pareto est la troncature sur l'intervalle ]x,, <[ de la loi 
puissance de paramètre & et de densité 


(x) ax7(atn x >0; 
PO 0, x = 0. 


On la rencontre dans les problèmes de statistique économique. 


f(x) f(x) 
LT 
| Ty De | m1 


FIG. 16. Densité de la loi de Pareto. FIG. 17. Densité de la loi de Sherman. 


6.2.17. Loi de Sherman. 1. Une variable aléatoire £ admet une répartition 
de Sherman, à n# degrés de liberté (de paramètre n1) si 


ÿ mb,x""1, xe€ Lo. 
fx) = LT" 


n : 

n+1]° 
nl 

0, vé [o. il 


La 
où bd, = à (—1}m 410 CH1C2,,Cr(Cr+}] ", r est un entier positif tel 


que n—r—] = n—r 
n+1 n+1 
(Cf. fig. 17). 


2mt3+mnn—-1)rtt 


| so Var £ = tri +1} 
] : OH G+ IP 


Les moments sont : EË — (1 _ ——— 
n+]1 


1 \2m+n0 
SNS ne 
n+i 


3. Soient n points uniformément répartis sur l'intervalle (0, 1]. Ordon- 
nons ces points et soit &, la longueur du i-ème intervalle à gauche des n+1 
intervalles possibles. 
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1 “+1 


ss admet une loi de 
2 ji 


1 
b——— 


La variable aléatoire & — 
n+i 


Sherman à n degrés de liberté. 


6.2.18. z-loi (loi du rapport dispersionnel de Fisher). 1. Une variable aléa- 
toire £ admet une loi z, ou loi du rapport dispersionnel de Fisher, à 
(m,, m2) degrés de liberté si 


" 
2m? m, Pr(s)ee 
(x) = ue XE]J-, œf. 


Tr (5) r(5:) (metier) ©? 


(Cf. fig. 18). 
f(x) 


0 T 


FIG. 18. Densité de la loi du rapport dispersionnel de Fisher. 


2. La fonction caractéristique a pour expression : 
“ rfi) r (fe) 
Me? 2 2 
60) = (7e) 5 — 


mn, ma) nf 
r()r() 
2 2 


LI Tate 


Les moments sont : EË£ = 0 ; Var £ = ni 
3. Si & est une Pate aléatoire admettant une loi à (m11, m.) degrés 

de liberté, alors £ = + In 7 admet une loi à (n1,,m,) degrés de liberté. 
Cette loi est d’un usage courant en analyse dispersionnelle. 


6.2.19. Loi de Weïibulk-Gnédenko. 1. Une variable aléatoire £ admet une loi 
de Weibull-Gnédenko de paramètres (œ, À) (À = 0) si 


læl Axa-lek®, x >0; 
JG = 0, x=s0. 


(CF. fig. 19). 
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& 
2. Les moments sont  E£t = À “r(£+i); Var & = 


= 2r(2)8 fr 


3. Cette loi apparaît comme la loi limite du maximum. Soient &, 
des variables aléatoires deux à deux indépendantes et identiquement répar- 
ties et P{Ë, « x} < 1 pour x < c, Posons 


, = max [é:, Êos se ë&,]. 


0<œ<i 


TL 
0 C) 


FIG. 19. Densité de la loi de Weibull-Gnédenko. 


Pour que la fonction de répartition F,(x) des variables aléatoires és 


converge pour un certain a, vers une fonction de répartition F(x) non 
concentrée en 0, il est nécessaire et suffisant que la fonction 1 — F(x) soit 
à variation régulière*) d'exposant « («= 0). Dans ce cas F(x) = e-À"*. 

La loi de Weibull-Gnédenko est souvent utilisée en théorie de la fiabi- 
lité pour décrire le temps de fonctionnement sans défaillance des machines. 


*) La fonction 1—F(x) est dite régulièrement variable d'exposant a si 1—F(x) = 
1x) 


L() 


= XaL(x), où L(x) est une fonction lentement variable, i.e. telle que 


—+ | pour 


1 —+ ©, Yx > 0. 
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6.2.20. Loi de Burr. 1. Une variable aléatoire £ admet une loi de Burr si 
sa fonction de répartition F(x) est de la forme 


1 
1 + exp — f g(u) 4] 
0 


où la fonction positive g(x) est telle que le second membre de la relation 
ci-dessus est une fonction de répartition. 

Sont variables aléatoires de Burr les variables de fonctions de réparti- 
tion : 


F(x) = 


FN) = 1- ___ xz0; 


CESSE 
I 


F(x) = re PROTL 


XE]—-o, œ ; 


ÿ-= 1 else. > 
ARTE T TT ET EE re] 2° |: 


F(x) = (£ arctg e” 4, NE]-, ; 


F(x) = (x-;; sin 2ax) , XE[0, 1]. 


2. Les lois de Burr, de même que celles de Pearson (en vérité, les 
premières bien moins que les dernières), sont utilisées en statistique pour 
l'ajustement des courbes analysées à des densités de probabilité. 


6.3. Lois de Pearson 


6.3.1. Définition. On apelle lois de Pearson des lois continues dont les 
densités sont solutions d’une équation différentielle de la forme 


df (x) _ dX + Go 
dx hrbarhee 60 


OÙ Go, Ans or D, b+ Sont les paramètres de la loi. Les lois de Pearson sont 
entièrement déterminées par les quatre premiers moments. 
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Soit u, le moment centré d'ordre k d'une variable aléatoire de Pearson. 
Sia, = l,ona 


a. = Mt 3H) , 
0 — À » 


p. — — M4pt— 33). 
0 A » 


3.2 
b, = — HG + 3113) . 
1 — 2 A , 


2tepta — 315 — 6u3 
ne 


où À = Op, — 18p — 12yu2. 
On distingue 12 types de lois de Pearson selon la distribution des 
racines du trinôme du second degré b,+b,x+ b,x°. 


ee Type 1°). 1. D < 0,1 < 0, b,+2b;x+h,x° = («+4 x) (—PB+x)b:, 
af >0 


2. La densité de probabilité est 


NT r)" (B— v)" vE[-« p] : 
SU) = $ G+J" BGm+ I, n+1) Le PI 
0, Y 4 [—«, B], 

où B(m + 1, n+1) = l'Gn+1) l'(n+1) , M >— 1], n>—|1. 


l'(n+n+2 
3. Si « = B (donc À = 0) et »n7 = n, alors les lois correspondantes 
sont de type II. Les lois du type IT possèdent un axe de symétrie vertical. 
Si m = — n, la loi correspondante est du type XII. 
4. Les lois bêta sont des lois de Pearson du type I. 


6.3.3. Type II. 1. D < 0, À =co, b,+2b,x+ bax? = 2(a+ x)b.. 
2. La densité de probabilité est : 
km +1 ; 
Fo = Ton PES RUE ER ER 0 
O, NÆE-ua. 


3. Les lois gamma sont des lois de Pearson du type II. 
Jp = bobs —b? est le discriminant du trinôme du second degré b,+2bix+b,x?, 


bi 
bob: 
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6.3.4. Type IV. 1 D —- 0, O0 < À = 1, bo+ 2b,x + b:x° = (x?+a°)b.. 


æz 
y as 


2. La densité de probabilité est : f(x) = ca?+ xt) re L À 
XE]-, œ[,mæ—., où 


œ 


z 
_— paretg - 
a 


ct | (a+ x") "e dx. 


6.3.5. Type VII 1. D > 0, À = 0, b,+2b;x+b.x* = (a+ x9b.. 
2. La densité de probabilité est : f(x) = _—— 0 (a?+ x)", 


B(m _ s] , 2 3) 
XE]-o, of, m> — 
3. La loi de Student est une loi de Pearson du type VIT. 


6.3.6. Type V. 1. D =— 0, À = I, bo+2bix+ b,x° = b,(x + a)? 
2. La densité de probabilité est : 


y 
si A 
vore *, y>0, m>1, x—-0; 


SO = | Tn-n: 
0, xs 0. 
6.3.7. Type VI. 1. D <0,2-— 1, h+2b,v+b,x? — (x1a«)(x —Pbs. 
2. La densité de probabilité est : 


(æ+p}-("tntn 


f(x) = B-m-n-1,n+1) (+) (x, xp, m-1>0, 


n>—1l; 
0, x & p. 


6.3.8. Type VII. 1. D<0, À<0, b,+2b,x+b,x? = x(x+x)bs. 
2. La densité de probabilité est : 
ant 


1 
ae ere xE[-a,0,] -1<m<0; 


0, xé[-«, 0]. 


6.3.9. Type IX. 1. D < 0, À < 0, b,+2b,x-+b;x? = x(a+x)bs. 
1. La densité de probabilité est : 


S(X) = | arr (x+a)", xE[-ax 0],  m<-1l; 
0, xE[-a, 0]. 
9 — 26002 . 


6.3.10. Type X. 1. D=0, À=0, b,+2b,x+b4x° = b,, a, = 0. 
2. La densité de probabilité est : 


f(x) = 


ve ?*, X > 0, Y > (4) ; 
0, x = 0. 


3. La loi exponentielle est une loi de Pearson de type X. 


6.3.11. Type XI. 1. D = 0, À est indéfini, b,+2b,x+b.x? = b,, a, # 0. 
2. La densité de probabilité est : 


x! 


1O= Le xe]-0, co. 


A/ 2710 


3. La loi normale est une loi de Pearson de type XI. 

4. Les lois de Pearson sont beaucoup utilisées en statistique mathé- 
matique pour le lissage des lois des données empiriques. Pour déterminer 
la loi de Pearson approximant les données observées, on calcule les quatre 
premiers moments et on trouve les majorations des paramètres à partir 
des équations (3.2). 


6.4. Lois à plusieurs variables 


6.4.1. Loi polynomiale. 1. Un vecteur aléatoire Ë = (£,, £s, ..., &) 
admet une loi polynomiale de paramètres (#7: Pj, Ps, ..., Pa) 


(0<nm<1, Yn=1)si 
P{È = om} = P{É, = mi, £a = ma, ..., & = my} = 
— n} ee Pre | "A 
mime... mi PaPs ++: Pa 
à 
pour m = (m,, m2, ...,nn), ) Mm=n. 
CES | 


2. La fonction caractéristique est : 


k n 
QU) = Ur tas... h) = (Sp) ’ 


Les moments sont : EË = np = n(p;, Ps ..., Pa), COV (6, &,) = 
= E(é,- Eë,) (4, -Eë,) = —NnpiPy i%j; Varé = np{l-p)). 

3. La loi polynomiale est le modèle multidimensionnel de la loi bino- 
miale. La loi marginale de chaque composante du vecteur & est une loi 
binomiale. 

Si &D, #2, ,,,, #9 sont des variables aléatoires indépendantes à 4 
dimensions, de paramètres (n,, p), (n:, p), ..., (n,, p) respectivement, le 
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La Fr 
vecteur Ë = D & admet une loi polynomiale de paramètres ÿ M, p). 
{si A | 


P = (Pa Pa ... Pr). ; . 
La loi polynomiale décrit une épreuve donnant lieu à #7 événements 


indépendants dont l'issue de chacun d'eux appartient à l’une de # classes 
disjointes p,(0 < p, < 1) est la probabilité que le résultat d’une épreuve 
Ek 


quelconque appartienne à la i-ème classe, Ÿ° p, = 1. 
CES | 


6.4.2. Loi uniforme. 1. Soit S un borélien borné de AR. Désignons par 
mes S sa mesure de Lebesgue de dimension K. 

Un vecteur aléatoire £ = (£,, £,, ..., &,) possède une loi uniforme 
dans S si mes S — 0 et si sa densité / (x) = f(x, xe, ..., x.) est égale à 


1 
f(n = { mes S” ns 
0, xésS. 
Dans le cas particulier important où S est un parallélépipède à k dimensions 
S = [a,, b,]X{@, b:,]X ... X{a, bi], 


a 6: 
f(x) = Il (,— a) 
0, xés. 


2. La fonction caractéristique a pour expression : 
| 


[ ("Pr etter) 
QU) = Gite = ——— en ——— 
Il (b,-4«) it Il ! 
dans le cas d’un domaine rectangulaire. 


6.4.3. Loi normale à deux dimensions. 1. Un vecteur aléatoire à deux 
dimensions £ — (£,, £,) admet une loi normale à deux dimensions si sa 
fonction caractéristique gr) = g(r,, f2) est 


Ut + mt) 2 Cut eatat À sat) 
gU=e . , 
2 
la forme quadratique Q(r) = Q(#,, 12) = Cylilys Cia = Ca étant non 
4,7 
négative, c'est-à-dire Q(r) > 0 pour tous #, et #, réels. Si le rang de la forme 
FL 131 


quadratique Q(r) est égal à 2, c'est-à-dire le déterminant de la matrice 
C = {cu i, j = 1, 2}, est différent de zéro, la loi normale à deux dimen- 
sions est dite non dégénérée ou propre. Si le rang de la forme quadratique 
Q(r) est égal à 0 ou à 1, la loi est alors dite dégénérée ou impropre. 

2. Si un vecteur aléatoire £ admet une loi normale non dégénérée, 
sa densité f(x) = (x, x2,) est 


SR) = a exp À — 
270,0; V 1 — 0° 2(1 — op?) 
GX) 20(xi—m13) (xs — Ms) (Ka — Ma)? 
é danse ne || 


Ji02 of 


X 


CE 20 CaiCr2 — Cia = OfOE(1 — 0°). 


FIG. 20. Densité de la loi normale non dégénérée à deux dimensions. 


La signification de "1, n12, O1, O2 et o est la suivante : m, = Eë, 
o = Varé,i= 1,2; E£,ëé, = EL£, = o,0,0+mims ; 
9 = Fi) Gsm) 
4 Var &, Var &, 


est le coefficient de corrélation des composantes &, et &.. 
Il est plus commode de mettre la densité de la loi normale non dégé- 
nérée à deux dimensions sous la forme 


1 
| 3 0 nm ss 0) 
JD = 1. = 
210,08 V 1-0? 
| _ : tete — m)t+tsin —m)(zs— mpte,s! (CA #1)? 
= > , 
27 4/det C 
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où 07 UT t2) est la forme quadratique inverse de Q(r), cÿ' les éléments 
de la matrice C”!. 

Les densités marginales de la loi normale s'écrivent 
_(æ = mn) 

VO Seb 


1 
74 Air. 
al ) \/27 0, 
La densité conditionnelle de la composante £&,, sachant que Ë, = a, 


est égale à 
SOx/Ës = 4) = 


a CO, , eu, . 
aa" le] } 
E{é/£: = a} = mit D (am : ; 

Ef£i-m)/E, = a} = ot — 09). 


La densité de la loi normale non dégénérée est constante sur les ellipses 


(x — : 1) 20x10) (Xa— ns) (xs M2)" ‘ 
fm 2e) Gama, am] je 
0103 03 


ET 


dites ellipses d'égales . Ja probabilité que le vecteur £ = (£1, £2) 


soit situé à l'interieur d’une telle ellipse étant égale à 1—e *. 

3. Si une loi normale à deux dimensions cst dégénérée et que le rang 
de la forme quadratique Q(r,, #,) soit nul, elle est alors concentrée au 
point m = (m,, ma) c'est-à-dire 


P{Ë — m} = 1. 


Si le rang de la forme quadratique Q(r,, s.) est égal à 1, la loi normale 
est concentrée sur la droite 


HG) + (Es me) = 0, 


où ?,, /4 parcourent la droite construite sur le vecteur propre de la matrice C, 
associé à la valeur propre zéro. 


6.4.4, Loi normale à plusieurs variables. 1. Un vecteur aléatoire £ = 
= (£1, Ë2, ..., &:) admet une loi normale à plusieurs variables si sa fonction 
caractéristique g1) = gr, f2, . .., 14) St de la forme 


g{) - exp {um —. sci}, 


où C'est £X4-matrice symétrique définie non négative, 1° le transposé du 
vecteur # € R', 
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Si le rang de la matrice C est égal à &, c'est-à-dire det € # 0, la loi est 
dite non dégénérée ou propre. Le vecteur m1 = (m1, ..., m,) et la matrice 
C'= {cyi, j = 1, ...,k}admettent la signification suivante : 


m = (m,, ..., nn) = (EËs ..., Es) = Eë ; 


C= {cu i, innu 1, , k}= {E(é,—m,) (65 — mi), À i, j = = l, °, k} = E(f-m)x 
X(ËÉ—m)° est la matrice des covariances. 

Si det C # 0, la matrice C7! est appelée matrice de précision. 

2. Si un vecteur aléatoire £ admet une loi normale non dégénérée, sa 
densité f(x) = f(x, ..., x) est égale à 


SN) = TT exp é (x —om) C x -m} 


Soient EM = (£,, ...,€), &D = (£6,,,,..., &). Le vecteur m des 
espérances mathémati ues correspondant à une telle décomposition 
du vecteur aléatoire Ë se représente par {1 = (m,,...,m,), m9 = 
= (mi, 08), MO = EE, j = 1,2, et la matrice des covariances C par 


C = (: | 
Cu Ce 
Où Chips Cas Cou Ces Sont respectivement des rX7r, rX(k—r), (kK—-r)Xr, 
(k—r)X(k—r) — matrices et de plus 
Cy = EE — m0) (ED — mt9)°, 


La loi marginale du vecteur &® est une loi normale de vecteur des 
espérances mathématiques m9, de matrice des covariances C,, et de densité 


A 60) = a exp {— (x — mn) CyxP = mE9)}, 
V/(Qz)idet C, 
= Te=k-r, 
sous réserve que det C 
Si un vecteur ie E = (é;, &,) admet une loi normale non 


dégénérée, la densité conditionnelle  fOCGDJED — da) du vecteur &t), 
sachant que £® = al?) est égale à 


1 det C 1 
D(XD/ER — gt) — —_— |} 7-32 _—— (xt — {ny 
SX ) Var | ie o | : (x )°x 


X (Cu CiaC re Co) (QU u)] 


où HD = mt4+C,C(a® nt), et de plus E{éN/E® — da = 
= mL C Cr 19 — nf?) : E{(E0 — 10) (EN _» D)*/E 2 = qd) — 
s Cu Cia Cu: 
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3. Si un vecteur aléatoire £ = (£,,..., £,.) admet une loi normale dégé- 
nérée et la matrice des covariances C'est de rang 7, 0 & r < k,ilexiste une 
kxr-matrice rectangulaire B telle que C = BB", et un vecteur aléatoire 
£, de dimension 7 possédant une espérance mathématique nulle et une 
matrice des covariances unité, tels que £ = m1+ Bës. 

4. La loi normale à plusieurs variables est, comme la loi à une variable, 
fondamentale en théorie des probabilités et en statistique mathématique, 
grâce surtout au théorème limite central. 


6.4.5. Loi de Dirichlet, 1. Un vecteur aléatoire £ = (£,, ..., £,) admet une 
loi de Dirichlet de paramètre & = («;,, ..., a), &« = 0, i=1,...,K, si 


L'Gitart FO) ou Le : 
SN) = Su... x) = | T(«,) l'(xe) ... Ie) Apr ESS 
0, x ES, 


à 
où S est un simplexe de dimension 4-1: S = fer: Du = }, 
CEA 


Xi = 0, i = , 4 


2 Rite où «y — ; a, ; COvV Ë Ë Re Var =. 
&o > cs ù a%(1 +@o) sr 7 

3. La loi de Dirichlet est l’analogue multidimensionnel de la loi béta. 

6.4.6. Loi f de Student à plusieurs variables, 1. Un vecteur aléatoire £ = (£,, 


E., ..., &#) admet une loi f de Student £-dimensionnelle à n degrés de liberté, 
de vecteur d'écart met de matrice de précision T si 


KW n 
SX) = à à Méouis [: "a (x—m})* T(x — m)] és , 
r()ver © ? 


où Test symétrique définie positive. 


2. Les moments sont: EËf = m; cov£ — E£-m)(£—m)*" = 
UE -1 
= pe, , NH > 2. 

3. Si 7 est un vecteur normal, d'espérance mathématique nulle et de 
matrice des covariances C — T7! non dégénérée et € admet une loi de 


4° à n degrés de liberté, alors le vecteur & = (£,, ..., 4), où ê, = % PE A LLTR 


admet une loi de Student k-dimensionnelle à n degrés de liberté, de 
vecteur d'écart »1 et de matrice de précision T, 


135 


Si un vecteur aléatoire £ admet une loi de Student k-dimensionnelle à 
n degrés de liberté, de vecteur d'écart #1 et de matrice de précision 7, alors 
la variable aléatoire 


t = ) T(E-m) 


admet une loi F de Snédécor à k et x degrés de liberté. 


6.4.7. Loi de Wishart, 1. Soit £ une £X£-matrice ou, ce qui revient au 
.. K(k+1) 
même, un vecteur de dimension ——. 
Désignons par X une kX4-matrice symétrique définie positive. La 
matrice aléatoire £ admet une loi de Wishart non dégénérée à n degrés de 
liberté et de matrice de Et Tsi det T # Oet 


n-£&-1 
det T)? (det X) ° 1 
PRRCLACTEREN RE" 
27x 4 I] (+=) 
J=1 
où Tr TX désigne la trace de la matrice TX, c'est-à-dire la somme de ses 
éléments diagonaux. 

2. Fonction caractéristique. Soit # une matrice symétrique de la forme 

2 fa... lu 
ie À @.n 

lin le... 2e 


La fonction caractéristique de la loi de Wishart est définie sur un en- 
semble de matrices symétriques de la forme (4.1) : 


ie detT 7? 
det (T— ir) (T—ir) 
3. Soient £t, £(9, ,,. Et des vecteurs indépendants normaux 


d'espérances mathématiques nulles et de matrice des covariances C non 
dégénérée. La matrice aléatoire £ — Danser admet une loi de Wishart à 


n degrés de liberté et de matrice de précision T = C°!, La loi de Wishart 
est l’analogue multidimensionnel de la loi de #'. 
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6.5. Lois stables 


6.5.1. Définition. Une fonction de répartition F(x) est stable si pour tous 
nombres réels a, > 0, a, > 0,b,, b., ilexiste a = Oct b, tels que 


F(aix+b,)%xF(a.sx+b,) = F(ax +b), (5.1) 


où x est le symbole du produit de convolution. 
Si gt) est la fonction caractéristique d’une loi stable, pour tous 
a, > Oeta, = Oilexiste bet a > 0 tels que 


dr re 


L'importance des lois stables est liée au résultat suivant. 
Théorème. Soient £,, £., ..., &, des variables aléatoires indépendantes 


identiquement réparties et 
1 n 
7h _— F. 22 E,—a,, (5.2) 


où B, = 0 et «, sont respectivement des constantes de normalisation et de 
centrage. 

Si F,(x) est la fonction de répartition des variables aléatoires n,, alors 
seules des fonctions de répartition stables peuvent être fonctions de répartition 
limites pour F,(x) pour n -+ co. 

Réciproquement, pour toute fonction de répartition stable F(x) il existe 
une suite de variables aléatoires de la forme (5.2), telle que F,(x) converge 


vers F(x) pour n —+ co. 
Il s'ensuit en particulier que les lois stables sont indéfiniment divisibles. 


6.5.2. Caractérisation des lois stables. 

Théorème. Pour que la fonction de répartition F(x) d'une loi soit stable, 
il est nécessaire et suffisant que le logarithme de la fonction caractéristique 
gt) de cette loi soit de la forme 


In go = it—clris { 1 +8 of, a)}, (5.3) 


où «, B,y et c sont des constantes telles que —-1 <hB&1, 0<a= 2, 
c>0et 
T e 
tg 7 % si «xl, 
o(t, &) = (5.4) 


2 intel si «=, 
7 


Le paramètre « est appelé paramètre de stabilité ou exposant caractéris- 
tique. 
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Toutes les lois stables à exposant caractéristique « - O sont continues 
ct Icurs densités admettent en tout point des dérivées de tout ordre. 
De (5.3) il s'ensuit que la densité de probabilité d’une loi stable est de 
la forme 
if ' 
. SR Ce = {tx PT 1 2 LB. a | 
f(xia hr, ©) 2: ( e"!"*cxp {ir clel (1 + 1p} nl OT UR 2))} dr 


—œo 


(5.5) 


Les densités des lois stables ne s'expriment pas au moyen des fonctions 
élémentaires à l'exception de certains cas. 

1. La loi normale d'exposant caractéristique « — 2 est stable. 

2. La loi de Cauchy d'exposant caractéristique « == 1 est stable. 

3. La loi de densité 


-£ 


, > 0, 


1 

1 3 
fu = | Vas" 
0, 


ei | 
et d'exposant caractéristique « = 3 St stable. 


4. La loi dégénérée d’exposant caractéristique &« — 0 est stable. 
Pour la densité f(x ; «, B, y, c) d’une loi stable d'exposant caractéristi- 
que « > 0,ona 


L 1 
lune? . æ, f, 0, ). «a < |; 
Jia hp, ce) = Lo 2 
e(()-85 Inc: 1,8,0, ). «=. 
(5.6) 


Donc, sans nuire à la généralité, on peut admettre que y = 0, c = 1. 
Si f(x ; à, A) = f(x ; à, P,0, 1), alors 


SA, a, B) = (x, a, — fi). (5.7) 
6.5.3, Développements asymptotiques. Si F(x) est une fonction de répartition 


stable d'exposant caractéristique «, il existe une constante c, = 0 telle que 
lim xz{1—F(x)+F(- x) = ci. (5.8) 


Chaque loi stable d'exposant caractéristique «(0 = « = 2) possède des 


moments absolus finis de tout ordre p(0 < p < a). 
Soit /'(x ; «x, B) la densité d'une loi stable. 
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Si0<a<1etx — 0, alors 


SX ; ah) = _ Lt sin F at + 1)] TUE+ 0 xls, 


(5.9) 


Six > 1, la série du sccond membre de (5.9) est divergente. 
Si 1 < & < 2, x = 0, alors 


l° (= ) 
[Q : à, f) = +È (— 1} — ni — x cos : (i+(i+2) 2e). 
(5.10) 


Sia < 1, la série du second membre de (5.10) est divergente. 
Six = 1,x = 0, alors pour tout N 


N 
[(+À in «, 1, 8) = => 74 xTE+O(x #71), 
où 


mes di 
b, Im Je a fi+i8-° ins) dt 


Chapitre 7 
PROMENADES ALÉATOIRES 


7.1. Processus de renouvellement 


7.1.1. Définition. Théorèmes fondamentaux. Les sommes successives 
bn = » SE n=> 0, Lo = Eo = 0, (1.1) 
k-0 


de variables aléatoires indépendantes positives, de même fonction de 
répartition F(x) = P{Ë,<= x}, constituent les instants (points) de renou- 
vellements (commutation, apparition d'un événement, etc.). 

On appelle processus de renouvellement la variable 


r()= max{n:ê,=<t}, (1.2) 
définie pour chaque # == 0. Si bien que 
v{)=npouré,<t<t,,s, nz:0, (1.3) 
ou cncore 
(1) = > En = 0). (1.4) 


Les trajectoires du processus de renouvellement sont en escalier, conti- 
nucs à droite et présentent des sauts de longueur 1 aux points de renouvel- 
lement &,, 1= 0. 

Un processus de renouvellement »{r) stoppé à un instant r exponentiel- 
lement réparti, de paramètre S(0 < s < 1) admet une loi géométrique de 


paramètre /(s) = Ee ‘* : 
Pr) 2-0} = fr) (1/6). (1.5) 


La fonction génératrice du processus de renouvellement 


Ez"n >s (| e"Ez"® di (1.6) 
( 
se représente par 
1— f(s) 
Là 1 0 ENTRER . (1. 
Ez 2/6)" (1.7) 
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Les moments factoriels 


Ev(r}n=s | e-"Ev(r}n at (1.8) 
0 
sont justiciables de la formule 
Er(r}") = Il SG) |" 
TT} = n! 1-fQl n> 1. (1.9) 
En particulier, 
. Erre _ JS) 
Ert)=s | e"Er) d= TS (1.10) 


La fonction N(t) = Ev(t)+1 est appelée fonction de renouvellement. 
La fonction N(t) est finie pour tous les # — 0 ct s'exprime au moyen des 
lois des sommes par (cf. (1.4)) 


N() = DLUET) (1.11) 


La fonction de renouvellement est solution de l'équation intégrale de 
renouvellement 


t 
NG)=1+ [ NG-x) dF(), 1>0. (1.12) 
0 
Le comportement asymptotique de la fonction de renouvellement est défini 
par 
. NG) _ ]! 
CR LE q19 


pour EË co. 
Théorème. L'équation de renouvellement 


ç 
UG)= gt)+ [ UG-x) FX), 1>0, (1.14) 


dans laquelle g{t) est bornée sur chaque intervalle fini, admet sur (0, + +] 
une solution unique U(t) de la forme 


0 
U(&)= [ gtx) 4N(D). (1.15) 
0 
Théorème de renouvellement. Si /a loi des variables Ë, n'est pas arithmé- 
tique, pour tous les h — 0 


lim [NG+h)-N(1)] = h/EË,. (1.16) 
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Si les variables =, admettent une loi arithmétique, alors (1.16) a lieu pour les 
h multiples du pas de la loi de &,. Le théorème de renouvellement s’énonce 
sous la forme équivalente. 

Théorème (clé de renouvellement). Si une fonction g(t) est intégrable- 
Riemann [67] sur l'intervalle (0, + ] et sië, admettent une loi non arithmé- 
tique, alors 


‘ œ 
lim [sc dN(x) = Er | g(e) d'; (1.17) 
1 —+ 1 
0 0 
si la loi de Ë, est arithmétique et de pas d, alors 
(+né 
lim g(t+nd-—x) dN(x) = 0 y gt +Kkd). (1.18) 
A —> co Eé; kE=0 


Exemple 1. Le processus de renouvellement dont les intervalles 
séparant les sauts suivent la loi exponentielle P{é, = 1} = 1—-e”*, 1æ0, 
est un processus poissonnien de fonction de renouvellement N(1) = at+1, 
t>0. 

Exemple 2. Le processus de renouvellement avec retard 


{ 
P{E, <1} = EE Ï [1— F(x)] dx (1.19) 
0 


cst appelé processus stationnaire de renouvellement. La fonction de renouvel- 


lement correspondante est N(1) = € ; 
1 


7.1.2. Compléments et précisions. 1. Si les intervalles séparant les instants 
de renouvellement £, possèdent une densité uniformément continue p({#) 
et la fonction q{#) = sup p(x) est intégrable sur l'intervalle [0, + [, alors 


az! 
la fonction de renouvellement N(1) admet une dérivée N’(1) bornée unifor- 
mément continue, telle que 
lim N'(4) = 1/EË,. (1.20) 


1 — 


2. Pour une loi non arithmétique F(r) de variance finie Var &, = u°? < 
<o, On a 


. ao 1° | 
lim [NW] = Er) +5. (1.21) 


3. Le processus de renouvellement est justiciable de la loi forte des 
grands nombres 


I OV 
P{ lim — v{t) = 1/Eëi} =. (1.22) 
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4, Si des variables £, admettent une loi stable de paramètre « > 1 et 
= np Li 
Ee = €" (c> 0), alors 


| 
Dir (1.23) 


5. Si des variables £, admettent une fonction caractéristique intégrable 
S(s) = Ee“: et f(s)—1 = cslogs pour s + 0, alors 


L 
N(t) v clogr pour f 00. (1.24) 


6. Soit »m, k = 1, une suite de variables indépendantes identiquement 


réparties de fonction caractéristique œÀ = Ee'”#, Le processus général de 
renouvellement est défini par la relation 


mt) 
vor) = x Ta (1.25) 


où v(t)est un processus de renouvellement défini par les instants de renouvel- 
lement &, = D &, (n > 0) de fonction caractéristique f(s) = Ee “+, 


La fonction caractéristique d'un processus général de renouvellement 
interrompu à un instant + suivant une loi exponentielle et de paramètre 
5, (0 < s < 1), est de la forme 


Een = $ (| e-"Ee"® dt (1.26) 
0 
et est définie par 
1— f(s) 
E ent = 1.2 
10/0 EL 
En particulier, pour E | 7,1 << 
Er,(t) = Er, Er) ; (1.28) 
et pour EË, <= 
P{ lim »,(r)/v(1) = Em} = (1.29) 
{— co 


7.1.3. Les processus de renouvellement réglés sont définis par les relations 
suivantes : le temps d'attente de l'instant de renouvellement (ou temps 
d’avant-saut) 


Vi = Gunsi-h 120; (1.30) 
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ou le temps écoulé depuis l'instant de renouvellement (ou temps d’après- 
saut) 


Pret 1220. (1.31) 


Les processus y} et y; sont linéaires par morceaux. Entre deux points 
consécutifs de renouvellement £, et #,,, le processus y} décroît linéairement 
de &,,1 à 0, quant au processus y;, il croît linéairement de 0 à &,,.. 

La somme y,=}+7; = +1 est la longueur de l'intervalle 
séparant deux instants consécutifs, comprenant le point #. On remarquera 
En loi de 6,441 n'est pas confondue avec la loi de £, pour & fixe (cf. 

omme relations liminales pour l'étude des processus de renouvellement 
réglés on peut prendre les relations stochastiques suivantes : 


veyte, 1æ0, ÿ,=-1,, 1<0; (1.32) 
vr Si <t)yea+4@ > 1), 1æ0. (1.33) 
(le signe -= signifie que les termes de gauche et de droite possèdent la même 


fonction de répartition). 
La fonction génératrice conjointe de >* et y; est donnée par la formule 


S Ee-—Ee-Wt+n 


Ee-## Tr = S 
stu-À  1-Ee 


(1.34) 


Les fonctions génératrices des processus réglés sont définies par 


e -At = st, 
Ee#r = 5 | etEe td ° ECUNEEE 435) 
s— 1—-Ee-* 
0 


et 
S 1—Ee-t+A 


———— (1.36) 
s+À 1-Ee-“: 


Ee”4r — “| e-"Ee*t dt — 
0 


Théorème. Si les variables aléatoires &, admettent une loi non arithmé- 
tique, il existe alors 


lim P{yt > x, >) = Be [ [1-- F(u)] du, (1.37) 
t-> © 1 
z+9 


pourvu que EË, <c ; si les variables E, sont à valeurs entières, il existe alors’ 
lim P{yt =£k, y5 =r})= _. P{£ = k+r}, (1.38) 
{ —+ 00 l 


lorsque t parcourt la série des nombres naturels. 
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Corollaire 1. Les lois limites de y} et y; pour ? > sont confondues 
avec la loi du retard stationnaire 


Him Ph <= lim PGr <a) pe [ (FO) dr. (1.39) 
0 


Corollaire 2. 
| LL 
dim P{yt+yr <x)= gr J » dFO. (1.40) 
0 


En particulier, 
lim Efy*+y7]= 2EË8,. (1.41) 
{—+ 


Exemple 3. SiP{é,<x}=1-—e"*, alors 
P{yt <x}= 1-—e"e, (1.42) 


Excmple 4. Si P{E < x} = ge [u-Fo» dy, alors 
s1 
0 


P{yt < x} = pe. ( [1— F(y)] dy, (1.43) 


ce qui explique la stationnarité du processus de renouvellement à retard 
stationnaire &,. 


7.2. Classification des promenades aléatoires 
sur Ja droite 


7.2.1. Critère de récurrence. La suite de sommes 
E,= DE, n2=0, o:-0, (2.1) 
k=! 


de variables aléatoires £, indépendantes de même fonction de répartition 
F(x) (0 < F(0) < 1) définit une promenade aléatoire sur la droite réelle. 

Les variables E, sont appelées pas (ou sauts) de la promenade, les 
sommes 6, définissent la position de la promenade à l'instant n(après n 


pas). 
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On appelle fonction de renouvellement d'une promenade aléatoire 
E,, n> 0, la fonction d'intervalle 


NA) -- D P{, € A), (2.2) 


où À est un intervalle de la droite réelle. 


Si Fest une loi arithmétique de pas d, on admet toujours que l'intervalle 
À contient au moins un point de la forme td. 

Théorème 1. On a l'alternative : ou bien N(A) << pour tous les inter- 
valles finis ou bien N(A) = pour tous les intervalles. 

Définition. Une promenade aléatoire &,, n=0, est non récurrente 
Si N(A) < © pour tous les intervalles finis, et récurrente si M(A) =< pour 
tous les intervalles. 

Soit v,, variable aléatoire représentant le nombre de fois où la pro- 
menade aléatoire &,, n > 0, tombe dans l'intervalle À : 


eo 


Va = > 1(Cn € A). (2.3) 


Théorème 2. Le nombre d'accès d'une promenade aléatoire non récurrente 
à chaque intervalle fini est presque sûrement fini et son espérance mathéma- 
tique est Ev, = N(A), À étant un intervalle. 

Le nombre d'accès d'une promenade aléatoire récurrente à chaque 
intervalle finiest presque sûrement infini. 

Critère général de récurrence d’une promenade aléatoire. 

Théorème 3. Une condition nécessaire et suffisante pour qu'une prome- 
nade aléatoire de sauts E, soit non récurrente est que 


im | Re Re dÀ <, (2.4) 
‘11 1—sEec"tr 
Cu 


Le critère (2.4) cst valable pour les promenades aléatoires dans un 
espace euclidien de dimension fini, c'est-à-dire lorsque &, = (£u, ..., Er) 


sont des vecteurs aléatoires de dimension m. Ceci étant, ÀË, = Ÿ° ,4, est 
Pœi 


lc produit scalaire des vecteurs À et &,, C un contour comprenant l'origine 
des coordonnées. 

En particulicr, une promenade aléatoire à deux dimensions est récur- 
rente si EË, = 0 et EË? <os, 

La promenade aléatoire est non récurrente dans un espace euclidien 
de dimension m > 3. 

Théorème 4. Une promenade aléatoire à une dimension de sauts &, 
et d'espérance mathématique E|Ë,| <c est récurrente si et seulement si 


E = 0. 
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7.2.2. Types de promenades aléatoires. Soient les variables aléatoires 
Gt = supé,, 67 = infé,. (2.5) 


250 n>0 


Théorème 5. // existe trois types seulement de promenades aléatoires. 

1. La promenade oscillante : P{0+ =) = P{{7 =co}= 1, 

La promenade partante vers —co : P{{7 =co)= 1, P{it < 
<oo} = À, 

3. Les promenade partante vers +c : P{êt =) = 1, P{T => 
> ©} — 

Les promenades aléatoires partantes vers — et + sont visiblement 
non récurrentes. 

Les promenades aléatoires oscillantes peuvent être aussi bien récur- 
rentes que non récurrentes. Par exemple, la promenade aléatoire dont les 
sauts suivent une loi de Cauchy est oscillante et récurrente ; celle dont 
les sauts admettent une loi symétrique stable de paramètre « < 1 est non 
récurrente et oscillante. 

Les identités factorielles du numéro 7.5 nous donnent le critère suivant 
de promenades aléatoires partantes vers — co. 


Théorème 6. Pour que P {su sup CL <= œ} = | il faut et il suffit que 


= = PE > 0} < oo. (2.6) 
n=1 
Ceci étant, 


P {sup = 0} = exp [- D LP P{, — 0j]. (2.7) 


n30 


Il existe un critère analogue pour les promenades aléatoires partantes 
VCrS + co. 
On remarquera que toujours 


> J P{£, = 0} <oo. (2.8) 


Donc, la condition (2.6) est équivalente à l'une des conditions suivantes : 


ÿ TL P{E, > 0) <o ; 
di (2.9) 


P {sup En <= 0} > (0. 


CE 2! 
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7.3. Fonctionnelles sur une promenade aléatoire 


7.3.1. Variables étagées. Les points étagés supérieurs stricts de la promenade 
aléatoire &,, # = 0, sont définis par les relations : 


1 = min{næ=1:6,> 0) (3.1) 


et 
0 = Gr. (3.17 


La variable aléatoire +4}? est le premier temps d'entrée de la promenade 
aléatoire €,, = 0, dans l'axe ]0, [, 71? la position de la promenade aléa- 
toire à l'instant d'entrée dans l'axe ]0, [ ou encore la valeur du premier 
saut du niveau nul. 

La promenade aléatoire 81) = € A .T$ y, 22 0, est stochastiquement 


équivalente à la promenade aléatoire cs : > 0. Les points étagés supérieurs 
stricts 1% = min fn 1:00 > O1 et 2) = ar de la promenade aléatoire 


£U), n> 0, sont les deuxièmes points étagés de la promenade &,, n > 0. 
Ceci étant, les couples de variables aléatoires (4, YU) et (T2), V2) sont 
indépendants et identiquement répartis. De façon analogue on peut 
définir (r%, y) pour chaque k = 1. 


Les suites {r4), k= 1} et {y®, kæ 1} définissent des processus de 
renouvellement emboîtés dans la promenade &,, n > 0. 

Les processus de renouvellement emboités s'arrêtent pour les prome- 
nades aléatoires partantes vers — c. La probabilité du premier arrêt au 
cours d’un pas fini est égale au défaut de 7, : 


P{r4 = co} = P {sup È, = 0} = CXP {ie P{é, = 0} . (3.2) 


Si P{sup bn =} = {, alors r, est une valeur aléatoire propre et 
n>0 


Er: = cxp ÿ + P{é, <= 0}. (3.3) 
On a des relations analogues pour les moments étagés inférieurs 
stricts 
_-=min{næ=1:6,< 0} (3.4) 
notamment 
. = 
P{r_ =) = P{inf = 0} = exp [- -ÿ Pt <0}| (3.5) 
et 
Er_ = cxp ÿ PA. > 0}. (3.6) 
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Donc 


Er, — cxp [È- P{È, — o)]/rtr- = co) ; 


Er = exp [Ÿ Pt, = 0)]/Ptrs ee) de 


On a l'alternative : l'un des moments +, ou r_ est une variable aléatoire 
impropre, la promenade aléatoire est partante vers —< où vers + ct 
alors ET_ <co où ET, <o ; ou bien Er, = ETt__=c (pour les pro- 
menades oscillantes ). 


Les variables étagées 7, et y, sont justiciables de l'identité de WVald : 
pour Er, <o et, de plus, 0 & EË, < co. 

Exemple 1. La promenade aléatoire dans le schéma de Bernoulli 
cst définie par les sauts £, = +1 avec les probabilités p et q = 1—p res- 


pectivement. Pour p = q, la promenade aléatoire bernoullienne est partante 
vers + co et Er, = 1/(p—q), P{r_ =c}= 1-—q/p; pour p <q la prome- 


nade cst partante vers — et Er_ = ——. P{r; =): 1-—p/q ; pour 


|| . e. e e , 
p=q=> Ja promenade aléatoire bernoullienne est oscillante et récurrente 


avec Er, = ETr__=0, 


7.3.2. Fonctionnelles supérieures. Les fonctionnelles supérieures d’une 
promenade aléatoire &,, n = 0, sont définies par les relations 


E,= max ti, n=0, Co=0; (3.9) 
0£kzn 
0,=min{k:t=t), nz=0, M=0; (3.10) 
= 0), n>0. (3.11) 
Es 


Théorème. On a les relations 


D Pl, = 0} = exp + P{,< 0}; (3.12) 
ÿ z"P{v, = n} = exp È _ P{&, > 0} ; (3.13) 
P{0, = k}= P({0,:= k}P{E,_: = 0}. (3.14) 


149 


De plus, les variables aléatoires 9, (le numéro du premier maximum) 
ct », (le nombre des termes positifs de la suite 6, (1 < # < n)) sont identique- 
ment réparties. 

Si les sauts de £, admettent une loi symétrique et continue pour tous 
les n:P{4,>0}=P{,= 0}= les lois des variables 7, , &, et 0, ne 
dépendent pas de celle de &, : 


Ez's = 1—4/1—z7; 


: (3.15) 
= 0 
P{r, = n} = PA, = 0) ; 
P{0, = n} = PÉE, = 0} = LT (3.16) 


Le comportement asymptotique des probabilités (3.15) et (3.16) se 
définit à l’aide de la formule de Stirling : 


P{0,= n} = PE, = 0} =; (3.17) 
ct 
PO (3.18) 


a Vk(n—k) 


La dernière relation exprime la loi locale de l’arcsinus. Dans le cas général 
on a la loi suivante de l’arcsinus. 
Théorème. Sous réserve de la convergence de la série 


e ri 
cs [Pt > 0)] PR (3.19) 
lim P40,<axn)= lim P{r, <xn}= À arcsin 3x. (3:20) 


La condition (3.19) est visiblement réalisée pour des variables aléa- 
toires symétriques &, ainsi que pour EË, = 0 et Var &, < oo. 
Exemple 2. Le processus d'attente #,, 7 > 0, défini par la relation 


W4y= max (0, W,+6,), n1>0, 


la valeur (ou la loi) de H, et la suite des variables aléatoires &,, n> 0, 
étant données, joue un grand rôle en théorie des files d'attente. 

Si les variables aléatoires de la suite £,, n = 0, sont indépendantes et 
identiquement réparties et W,= £, = 0, les variables aléatoires W, ct 


6, = max Ÿ &, possèdent la même loi. 
1 
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7.4. Problème de la ruine pour les promenades 
aléatoires scmi-continucs 


Diverses situations se ramènent aux problèmes de ruine, qui en termes de 
promenades aléatoires &,, n=0, s'énoncent comme suit. Considérons 
deux écrans absorbants placés l'un (le supérieur) en un point x = 0, l’autre 
(l’inférieur) en un point — y (y > 0), T = x +7. 

Définissons les temps de sortie de la promenade aléatoire &,, n> 0, 
Co = 0, de l'intervalle { — y, x] (les temps de ruine) en fonction des niveaux 
inférieur et supérieur : | 

7, min (ur: ê, y} ; | an 

= min{n:è,> x}. 


Les probabilités de sortie de la promenade aléatoire &,, n > 0, (les 
probabilités de ruine) s'expriment cn fonction des niveaux inférieur et 
supérieur par 


Or) = PH, < x, 0<n<Tr.,); 
(4.2) 
Q'(H=P{É, > x-T, 0&n< TT} 
Les fonctions génératrices des temps de ruine sont définies par 
B,(x, z) = E[z"r-:,0, < x, 0< n<Tr_)] ; | (4.3) 
BT(x, z) = E[z"* 1 = x-T, 0<n<s r)]. | 


Supposons que la loi de la valeur des sauts de £ est réticuléc et semi- 
continue Inféricurement, c'est-à-dire P{È = —1}= 1 et Ez° = p(z). 

Le potentiel {R,, & = 0} sur l'axe k = 0 de la promenade aléatoire 
hs 420, dont la fonction génératrice des sauts est p{z), est défini par 


(2) = pl AR = [(pG@)-1J". (4.4) 


La résolvante {R,(À), & > 0} sur l'axe k > 0 de la promenade aléa- 
toire &,, n = 0, dont la fonction génératrice des sauts est p{z), cst définie par 


ra(z) = 2 z° R:(Q) = [Ap()- 1}! (4.5) 
Théorème. Les probabilités de ruine (4.2) vérifient la relation 
Qr(N)=1-Q'(N = R/Rr, 0O<x<T. (4.6) 
Les fonctions génératrices des instants de ruine (4.3) vérifient les rela- 
tions 
Byr(x, À) = R,(2)/Rr() ; (4.7) 


r z 
BT(x, À) = Ë —(i- D 2 RG] R, (à) ] Rr()+(4-—1) 2 R,(). (4.8) 
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A noter que si Eë = 0, le potentiel peut être défini par la loi du maxi- 


mum 6 = max 6, 
n>0 


R, = P {maxe, <k}/p{maxt, = 0} P{£= 1} (4.9) 


7.5. Identités de factorisation 


7.5.1. Identités de factorisation fondamentales. Soit donnée une suite 
&,, kæ 1, de variables aléatoires indépendantes identiquement réparties 
de fonction caractéristique g(2) = Ee‘*t. 

La suite des sommes &,, # > 0, es = 0, définit une promenade aléatoire 
sur l'axe numérique. 

Les identités de factorisation pour la fonction 


1—270) = y4(z, À)p_(2, 2), Im = 0, (5.1) 


où les facteurs w.(z, À) sont analytiques dans les domaines Im À > 0 et 
Im À < 0, continus et bornés dans les demi-plans fermés Im 10 et 
Im <= 0 respectivement, sont très importantes en théorie des promenades 
aléatoires. 

La fonction y,(z, À) (resp. y_(z, À)) est appelée"composante positive 
(resp. négative) de la factorisation. 

Le problème de factorisation, c'est-à-dire la représentation de la 
fonction caractéristique sous la forme (5.1), est une variante du problème 
de Cauchy-Riemann en théo:i: de:s problim:s aux limit:s pour les fonc- 
tions analytiques. 

L'identité de factorisation fondamentale résulte sans peine du dévelop- 
pement 


1—zg(À) = exp In (1—z7(2)) = exp {-5 LC) | (5.2) 


Théorème 1. Pour |z] < 1, Im À = 0, /a fonction 1—zq{(À) se repré- 
sente par 
1270) = p4(z, À)7-G, Dpo(2), (5.3) 


où 


p+(z, À) = exp {- ÿ El, > 0)]} ; 


g{z, À) = exp {-ÿ ete LC < o]} (5.4) 
Po(z) = Exp {-ÿ Pt = 0}} 
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Les fonctions p, (z, À) et gç_ (z, À) sont respectivement les composantes 
positive et négative de la factorisation et vérifient accessoirement les con- 
ditions suivantes : 


inf lpaG 10, paGté œ) = 1. (5.5) 
0 


Les composantes de factorisation g:(z, À) et g.(z) admettent une inter- 
prétation probabiliste en termes de fonctionnelles frontière d’une promenade 
aléatoire &,, n = 0. 

Les instants étagés stricts s’introduisent comme suit : 


T4 = mie {k>1:64:=>0}; (5.6 
T- = min{kæ1:6,< 0). 
Les variables étagées sont définies par : 
Va = dat | (5.7) 
 —- Êr_. 


La quantité Tr, est dite temps d'entrée dans l’intervalle ]0, + cf. 
Par analogie, r_ est le temps d'entrée dans l'intervalle ] — , O[. 
La variable étagée y, (resp. y_) est appelée première somme positive 
(resp. négative) ou point d’entrée dans l'intervalle ]0, + [ (resp. ]— co, Of). 
On remarquera que la variable aléatoire 7, est définie seulement sur 


les suites de sommes à, n > 1, telles que t = sup &, > 0. Le cas échéant, 
c'est-à-dire si & 0, on admet que 7, =. 
De façon analogue, 7_ est une variable aléatoire impropre si P{ = 
=inft,>» 0} > 0. 
Théorème 2. Pour |z|æ&1, Im À = 0 on a l'identité de factorisation 
1—2(4) = {1—E[e"#+ 2+ (74 <co)]} {1 -E[e%>-2"- (7 < 
< c)]} po(z), (5.8) 


où p{2) est définie dans (5.4). 
Définissons les variables étagées engendrées par la promenade aléa- 
toire &,, 1 0 : 


1% = min{kæl:62>0)}; 
2% = min{kæ=1:6,< 0) | 4 
et 
va = (5.10) 
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Théorème 3. Pour |[z|<1 on a 
1- E[e‘+ 2" 14 = 0) = 4 {2) {: — E fe“ 2" y(Ts < co)|} . (5.11) 


1= fe 2% (re <00)] = pots) {1-EfeŸ-2- y(r- <c0)]}. (5.12) 
Ceci étant, | ; 
qua) = 1-El2"* 202. = 0] = 1-EL2"- 26° = 0]. (5.13) 


Les théorèmes 1, 2 et 3 permettent de déduire de nombreuses relations 
pour les fonctions frontière de suites de sommes &,,, n 2 0. 
Corollaire 1. Pour |z| Æ 1 


1— Efety+ 27+ y(r4 <)] = exp = x … Efe‘#: y > o] ° (5.14) 
&=1 


1—Efer)-27-;/(T_ <co)] — exp {- > _ E[e'k: y, < o]} (5.15) 
1 


Corollaire 2. Pour Im À — 0 
1 —g{(À) = [1 — E(e"?+ AT+ < co))] [1 _E(e*- 402 < co))] . (5.16) 
La loi du maximum & = max &, de la suite de sommes &,, n = 0, cst 
n>0 


aussi définie par des composantes de factorisation. 
Théorème 4. Si p = P{r; <c)< 1, alors pour 1m Àz 0 


EeX — (1—p){1—E[e"? (7, <)]}"!, (5.17) 
où : 
Ee% — (1-po){1-E[e"" y <)]}"!, (5.18) 
Où Po = P{T$ <c}, : 
La fonction génératrice de la loi des maximums &, = max(0,6,,6.,...,0,) 


se définit comme suit. 
Identité de Pollaczek-Spitzer. Pour |z| < 1, Im > 0 


D, 2° Bet = exp D + -Ef(e-1);6, > 0)] = 


n.0 1—z 


Le à 2 4 max (0,0,) 
= exp À À Ee | (5.19) 


7.5.2. Exemples de formules explicites. 11 existe une classe de lois pour 
lesquelles les composantes de factorisation ont des expressions analytiques 
explicites. 
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Exemple 1. Les lois des variables étagées y, et y° et du maximum 
& = max &, possèdent des expressions analytiques explicites simples dans 
nm0 


un cas important pour les applications (en théorie des files d'attente, dans 
les problèmes de ruine etc.), le cas de lois semi-continues de la valeur des 
sauts, lorsque par exemple la queue de la loi des sauts est exponentielle : 


1—-®(x) = PÉZ=x}=Ce*(C-0,a>0), x = 0. (5.20) 


Pour x = 0 la loi P{Ë < x} = ®(x) est arbitraire. Dans ce cas les variables 
y. et 7, sont indépendantes et 


P{y, <x)=p(l-e"*), p=P{r; <o). (5.21) 


De plus, 
P{O<x}=1-pe" "trs, 1-p=P{ = 0). (5.22) 


Si existe E£=—0, alors p=P{r, <æ})=1; or P{r__<c})= 
= [—-aEË< 1], donc 


P(x) = P{ < x} = D(x)+a [ PG)dy, x<0, (5.23) 


et par suite on a la formule de Khintchine-Pollaczek 
Pin (QE s = (1-aEt) ÿ P(x), x<0. (5.24) 
n30 na=0 


Si EË < 0, alors p = P{r, <co}< 1 (mais P{r_ <c}= 1). La cons- 
tante p est définie dans ce cas par 


A ai 
p=1-t, (5.25) 


où y, est l’unique racine positive de l'équation g{— io) = 1. 

La loi de >» est définie par la formule (5.23). 

Les formules citées dans l'exemple sont également valables dans le cas 
où la valeur des sauts se représente par une différence de variables aléa- 
toires indépendantes positives £ = £,;—£_ de lois P{E, > x} = {e”*, 
xæ0 et P{E_ = x} =®_(x), x < 0. Dans ce cas, pour x -0ona 


P(X)= P{É<x}=1-Ces, C= [e:db (x), (5.26) 
0 


et pour x & 0 


(x) = P(É<x}= es" [e- db (y). (5.27) 


155 


Ceci étant, la variable étagée y° a pour densité 
d 
Fr P{ < x} = ab _(x). 
Des résultats analogues ont lieu pour les lois réticulées dont les sauts 
positifs admettent une loi géométrique : 
P{æk}=Cg-1(C-0,q>=0), K=1,2:.: (5.28) 


(pour qg = 0 on admet que q°? = 1). 
Exemple 2. La promenade aléatoire exponentielle est définie 
par une loi exponentielle bilatérale de la valeur des sauts : 


_b__ a 
b+i a—ii 


Dans ce cas les expressions explicites des facteurs ,(z, À) (cf. théorème 1) 
sont données par (pour b = a): 


g() = Eett = (5.29) 


P+(z, À) = 1 -.#@ , _— 
ME: 
LS b+i ? 
2u(z) = a+b—1/(a+b)*-4abz. (5.31) 


Du théorème 2 on déduit les expressions des fonctions génératrices 
des moments étagés : 


Efz"[}(r <c)]] = #0 : 


Efer-{x(r <c)]] = “©. 


Pour b=<a j défaut de la variable aléatoire 7, est égal à 1—b/a = 
= P{r, = co), 
< lois des variables étagées y, sont exponentielles et de densités 
be”°: et be”? respectivement. 
La loi du maximum (pour b = a) est aussi exponentielle : 


(5.32) 


P {max <= x} = Î- 2 en (5.33) 


n 0 


Exemple 3. La promenade aléatoire binomiale est détinie par 
une loi binomiale de la valeur des sauts : P{£,—+41}=9p, P{i, = —-1} = 


= 9, p+a= 1, gQ)= Ee%t = pe+ ge "à, 
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Les composantes de factorisation sont définies par 


P+(z, À) = 1—e"lu;(z) ; 
p_(G, À) = 1—-eu_(z) ; | 65:34) 


u4(2) = [1 —4/1 — 4pqz° |/2qz, u (2) = [1 — 4/1 = 4pqz]/2pz : (5.35) 


Po(z) = _. [1 +V1 — 4pqz;]. (5.36) 


7.5.3. Fonctionnelles frontière. Les fonctionnelles frontière supérieures sur 
une promenade aléatoire &,, næ 0, liées à l'accès au niveau positif, se 
définissent comme suit. 

L'instant de premier accès au niveau positif x = O est : 


7,=min{£æl:éæ x) (5.37) 
La valeur du premier saut du niveau positif x > 0 est : 
Va = Cr Xe (5.38) 


Théorème 5. Pour |z| < 1, 1m 23 0, Im y = 0 


Auf 4 ps _ P+(z, 41) 
2 e d, E z'se'""? 41 <=) = Te D: (5.39) 


Et de plus Ti0 = T3, Y+0 = V4: 

Si la fonction caractéristique g(4) = Ee‘Ÿ? de la valeur des sauts est 
analytique dans une bande — À, = Im À < 0 et g(—i2.) > 1, on a alors 
l'identité de Wald pour x = 0 : 


Ef[z'seltts/(r, <c)] = e-An, (5.40) 
où À(z) est la racine dominante de l'équation 
1—2z/(—iÀ(z)) = 0. (5.41) 


L'identité de Wald est valable pour une situation plus générale pour 
l'instant de sortie 75 = min {n : 6, € ]—a, b[} de la promenade aléatoire 
6,» 2æ0, de l'intervalle fini ]—a, b[ et pour la position ds à l'instant 


de sortie. Elle s'écrit alors 


el soi te *4} np 


Cette identité est utilisée en analyse séquentielle pour l'estimation de la loi 
de 7. 
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Si la loi de la valeur des sauts est semi-continue et a une queuc 
exponentielle ou géométrique, i.e. P{êæx}=Ce-“(C>0, a>0, 
x=>0) ou (dans le cas réticulé) P{£æk}=Cg-1,C>0,q2>0, 
k= 1,2, ..., alors les variables aléatoires v, et y, sont indépendantes et 


P{y,æ t/r, <æ)= et, (5.42) 
ou dans le cas réticulé 
P{y, >k/r, < )} al q. (5.43) 
L'identité de Wald (5.40) entraîne 
Efarx(r, <co)] = 270) eue, (5.44) 
ou dans le cas réticulé 
1 — get) je 
Ef[z":}y(r, < co)] _ eg es, (5.45) 


Des formules (5.44) et (5.45) il s'ensuit que 
x 1 dx 
Pre n)= Et [Er], (5.46) 
ou dans le cas réticulé 


P{r,=n}= + P{, = x}+ i 


— [re = x} 


(5.47) 


où p,(x) = TL P{, < x) est la densité de probabilité des sommes {, 
pour x >0. 


Pour une promenade aléatoire réticulée semi-continue telle que q = 0, 
c'est-à-dire telle que P{é —-1}=0,ona 


P{r,= n}= + P{U= x}. (5.48) 


Chapitre 8 
CHAÎNES DE MARKOV 


8.1. Définitions. Propriétés générales 


8.1.1. Définition d’une chaîne de Markov. L'une des plus importantes 
généralisations de la notion de suite de variables aléatoires indépendantes 
est la notion de suite de variables liées en chaîne de Markov. 

Soit donné un espace probabilisé (9, %, P). On appelle élément 
aléatoire dans (#, 8) une application mesurable &£ : (9, %) — (X, D), 
où (X, 5) cest un espace mesurable. 

On appelle chaîne de Markov une suite {£,, 7 = 0, 1,2, ...} d'éléments 
aléatoires dans un espace mesurable (X, Ÿ) telle que 


P{é, € l'IE TT 1 E,-2) + P(é, É l’JFn-1} 


presque sûrement quels que soient Z'E 8 et n = 1,2, .... L'espace (X, 3) 
est dit espace des phases de la chaîne. 

Toute suite d'éléments (aléatoires ou non) {é,, n = 0, 1, ...}de l'espace 
(#, 8) peut être considérée comme le mouvement d'un système (d’un 
point, d'une particule) dans l'espace des phases : à l'instant 1 le système 
quitte l'état &, pour l'état &,, à l'instant 2 l'état &, pour l'état £,, etc. La 
notion de chaîne de Markov distingue donc dans l’ensemble des systèmes 
en mouvement les systèmes dits sans postaction ou systèmes sans mémoire. 
Dans le cas déterministe ce sont ces systèmes dont l'état à un instant # 
est déterminé de façon unique par l'état à l'instant 7 — 1 indépendamment 
du mouvement du système avant cet instant. Contrairement aux systèmes 
déterministes, les systèmes stochastiques sans postaction sont tels que 
l'état à l'instant n— 1 est défini de façon unique non pas par l’état à l'ins- 
tant 7, mais par la probabilité avec laquelle il se trouve à cet instant dans 
tel ou tel ensemble d'états. 

Exemple 1. La suite des éléments aléatoires indépendants 
(6, n = 0, 1, 2, ...} forme une chaîne de Markov, puisque 


P{é, € T'JË0 Êe .….…s En} P{é, € l'fË-1} dE P{é, € r}. 


Exemple 2. Promenades aléatoires. Soient X un groupe com- 
mutatif additif, 8 une tribu de parties de X, compatible avec l'addition 
dans X, c'est-à-dire 1€ 9 = l'+x = {x+z, z2€1%€B, VxE X. Soit 
donnée une suite d'éléments aléatoires indépendants {»,, n# = 0, 1,2, ... 
dans (4, 3). Alors la suite {&, = 7o+m+ ... + n = 0, 1, 2,... 
est une chaine de Markov dans l’espace des phases (X, 5), puisque 


P{é, € l'JËo êts …. Ës-1} “ P{S,-1+ n € l'IE} 
159 


pour tous les: ZE % et n = 1,2,.... Une telle chaine est dite promenade 
aléatoire dans X 

Supposons, par cxemple, que X est l'ensemble des vecteurs d’un espace 
pere R", dont les coordonnées sont entières dans une certaine base 
lis Ces. Em > À la tribu des parties de X. Si, des vecteurs aléatoires 
Mu 7», -.. à valeurs dans X sont indépendants ct rss répartis, 
la promenade (E, = ot M+ . + = 0, f, 2 .s S'appelle pro- 
menade]aléatoire sur un réseau entier dans R*. Ici 0 ‘est un vecteur aléa- 
toire ne dépendant pas de la suite {7,,tn = 1, 2, Si et à valeurs dans À. 
En particulier, si des vecteurs 7», k = 1, 2. ., prennent les ” valeurs 
+e;, tes ..., te, avec la probabilité 2 ue alors la promenade 
se déroule de telle sorte que la particule (le système) passe en une unité 
de temps et avec des probabilités égales du point considéré en un des 
points voisins (on appelle voisins,de x € X les points de la forme x+e;, 
Xx+tes ...,xte,). Cette promenade est dite promenade symétrique élé- 
mentaire sur un réseau entier dans R”. 

On obtient un autre exemple de, promenade aléatoire en prenant 
pour # Kia R", pour $ la tribu des boréliens de R" et pour 
{mn k = 1,2, ...} des vecteurs aléatoires indépendants identiquement 

artis 


Exemple 3. Promenades aléatoires bornées. a) Soit de nouveau 
X un groupe additif commutatif, B une tribu de parties de X compatible 
avec l'addition sur ÆX (cf. exemple 2). Considérons un ensemble D € 8 et 
désignons par #, la trace de la tribu $ sur l’ensemble D, c'est-à-dire la 
tribu des ensembles de la forme l'N D, l'ESB. Supposons que pour 
un certain ensemble DES est définie une application mesurable 
p : (X\D, Br) —+ (D, BD) et pour un sous-ensemble D’ € D, D’ E B une 
application mesurable y : (D’, B,,) — (D, #,). Soient {m,, n = 1,2, . 
une suite d'éléments aléatoires indépendants identiquement répartis dans 
(4,8), m un élément aléatoire dans (D, 8.) ne dépendant pas de la 
suite {7,, 1 = 1, 2, ...}. Posons &o = %o et 


Én+ Ch Xy($n) Ps) + Xp (x) [+ Tn+1) 7 Cas 
++ usa) Ann Tos)h n=0,12,..., (11) 


où y/(x) est l'indicateur de l'ensemble LC X, c'est-à-dire une fonction 
égale à 1 pour x € J' et à O pour x & Z!. Sous ces conditions la suite 
(En n = 0,1,2,...} forme une chaîne de Markov dans (D, 8,) appelée 
promenade aléatoire réfléchie. Dans une telle promenade le mouvement de la 
particule se décrit de la manière suivante. Si à un certain instant la particule 
se trouve en un point x € D”, à l'instant suivant elle « saute » en y(x) € D. 
Si £, = x € D\D’ à l'instant », alors la particule passe à l'instant #+ 1 au 
point x +7,41 SOus réserve que x +7,41 € D ; le cas échéant elle passe au 
point gx ++ y). 
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Considérons quelques cas particuliers de ce modèle. Soient X un réseau 
cntier sur la droite, D l'ensemble des entiers positifs, D’ un ensemble vide, 
g(x) = 0 pour tous les x € X\D et (7, 1 — 1,2, ...} unc suite de variables 
aléatoires indépendantes identiquement réparties prenant les valeurs + 1 et 


— | avec la probabilité 3 chacune. Si 7, est une variable aléatoire à valeurs 


entières positives, ne dépendant pas de la suite {»,, n æ 1}, alors la suite 
(é, n = 0, 1, 2,...}, où, en vertu de la formule (1.1), & = 70, n41 = 
= (Ets à) Ent Un 1), n = 0, 1, 2, ..., forme une chaîne de Markov 
appelée promenade aléatoire élémentaire avec écran réfléchissant inhibiteur 
en zéro. La particule errante se comporte en tous les points x = 0 exacte- 
ment comme dans une promenade symétrique élémentaire, c'est-à-dire de 


x elle accède en x + 1 ou x — 1 avec la probabilité 5 - Si la particule arrive 


au point x = 0, elle peut y rester pendant une durée de temps aléatoire 
ayant une loi géométrique et ensuite sauter en x = I. 


Pour obtenir une promenade aléatoire élémentaire réfléchissante et 
non inhibitrice, il faut choisir X, D, get {n,, n = 0, 1,2, ...} tels que dans 
l'exemple précédent. Pour D’ prenons l'ensemble {0} et soit y(0) = 1. 
On a alors à — os St —= L{0(n) + Xp1(0)(5%) (És +7,21) n = 0, 1, 2, .. 
Ceci signifie que la particule errante accède au point x = 0 qu'elle quitte 
au pas suivant pour le point x = 1. Dans tous les autres points (x > 0) la 
particule se conduit exactement comme dans l'exemple précédent. 


On construit de façon analogue les promenades aléatoires avec deux 
écrans réfléchissants. Soient, par exemple, a et b deux nombres entiers, 
a < b, D l'ensemble de tous les entiers de l'intervalle [a, b], D’ = {b}, 
y) = b—1, gx) = a pour tous les entiers x < a et g(x) = b pour tous 
les entiers x > b, la suite {y,, n =: 1,2, ...} est celle de l'exemple précédent, 
7) une variable aléatoire ne dépendant pas de la suite {y,,n = 1}, dont 
les valeurs sont les nombres entiers de l'intervalle {a, b]. Dans ce cas 
So ns 1/0» Sn+i = 4py(C) (— 1)+ Ye, u(°») [CS +41) Lie, (nt +1) + 
+ Gffa-Entlau)h 2=0,1,2,..., c'est-à-dire la suite {é,, n = 
= 0, 1,2, .….) cst une promenade aléatoire élémentaire pour laquelle le 
point a est un écran réfléchissant inhibiteur et le point b un écran réfié- 
chissant non inhibiteur. 


Voici encore un exemple de promenade aléatoire réfléchie à plusieurs 
dimensions. Soient XÀ = R",% la tribu des boréliens de R”,e,,63, ..., ms 
une base de R". Désignons par x la i-ème coordonnée du vecteur x € R°, 


ie. x = D ve. Posons D = {x:x€ R", x! æ 0}, g(x) = —x'ei+ À ve, 
{=1 i=2 
pour tous les x € R"\D, D’ = GS (S est l'ensemble vide). Supposons en- 
core donnés une suite {»,, n = 1, 2, ...} de vecteurs indépendants aléatoi- 
res identiquement répartis dans R*' et un vecteur aléatoire », € D ne dépen- 
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dant pas de cette suite. Sous ces conditions, si 


o = Mo Énti = (En tn+1) Ent n+1) +7 Ent MmrDX 
X Ann HEn + ns) n=0,1,2;:.: 


alors la suite {£,, n = 0, 1, 2, ...} est une chaine de Markov dans le demi- 
espace (D, B,). Nous avons affaire ici à un exemple de promenade aléatoire 
dans laquelle la réflexion est celle d'un rayon lumineux sur l'hyperplan 
x'= 0. 
Soit (#, 8) le groupe commutatif additif de l'exemple 2, $ étant une 
tribu. Donnons-nous un ensemble D, € $ et une suite {7,, n = 0, 1,2, ...} 
d'éléments aléatoires indépendants dans (#, 8) et construisons une 
nouvelle suite (En n = 0, 1, 2, ...} à l’aide de la formule £, = 90, £n41 = 
= Etn(E) + (Ent 41) Zn (és), # = 0, 1, 2, .... Cette suite forme une 
chaine de Markov dans (Y, 8). On l'appelle promenade aléatoire avec 
absorption dans l'ensemble D,. Une particule qui à l'instant # se trouverait 
en un point x & D, passe à l'instant suivant au point x +, ,.. Si la particule 
tombe dans un point quelconque de l'ensemble D, elle y restera à jamais. 
Exemple 4. Promenade aléatoire éKmentaire à probabilités 
variables. Soient X l’ensemble des entiers positifs, 8 la tribu des parties 
de X. Les points x € X figurent l'état d’un système. Supposons qu'aux 
instants 0, 1, 2, ... ce système change d'état de telle sorte que se trouvant 
à un instant # dans x = 0 il passe à l'instant #7+ 1 dans l’un des états x — 1, 
X, Xx+1 respectivement avec les probabilités Q,, r,, P,, P,+4,+r, = 1. 
Si x = 0, le système ne peut passer qu'aux états 0 et 1 avec les probabilités 
ro et Po respectivement, r5+ Po = 1. Supposons que les changements d'états 
à l'instant x +1 ont lieu indépendamment (au sens probabiliste) du mouve- 
ment du système avant l'instant ». Ceci veut dire que si &, est l'état du sys- 
tème à l'instant n, alors on a 


P{É, : 1 € T/Ë0 Ë ie 68) _ P{én+ 1€ TE), 


pour l'E Bet n = 0,1,2,.... Autrement dit, la suite {£,, x = 0,1,2,...) 
forme une chaîne de Markov que nous appellerons promenade aléatoire 
élémentaire à probabilités variables. 

En toute rigueur, la chaine de Markov envisagée dans cet exemple ne 
peut être considérée comme étant donnée, puisque à priori on ne sait pas 
si l'on peut définir l'espace probabilisé (9, %, P) et les variables aléatoires 
Eos En Êe - Sur 9 de telle sorte que soient réalisées toutes les conditions 
assujettissant &,. On formulera plus bas un théorème général (théorème 2) 
qui montre en particulier que la suite {£,, » = 0, 1, 2, ...}, qui représente 
une promenade aléatoire élémentaire à probabilités variables, peut être 
définie sur un espace probabilisé. 

Exemple 5. Systèmes de files d’attente. Considérons un système 
d'attente de »1 stations. Supposons qu'à des dates aléatoires (entières) 
arrivent des unités qui sont aussitôt servies dans les stations disponibles. En 
cas d’indisponibilité, les unités restent en attente. Chaque unité est servie 
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pendant une durée de temps aléatoire, ensuite clle quitte le système. Soient 
réalisées les conditions suivantes : 

a) les unités arrivent une par une aycc une probabilité p indépendam- 
ment des unités précédentes ; 

b) si une unité est en service à un instant », elle finira d'être servie à 
l'instant n+ 1 avec une probabilité g indépsndamment de la durée de ser- 
vice antérieure ; 

c) dans chacune des 1 stations, le service d’une unité ne dépend ni de 
celui fourni dans les autres stations ni du processus d'arrivée des unités. 

Désignons par &, le nombre total d'unités accédant au système à l'ins- 
tant # (ce nombre comprend les unités servies et les unités en attente). 
Alors {ë,, n# = 0, 1, 2,...}est une chaîne de Markov telle que pour tous 
les KE[1, m] 


Phi k—jlé, = K} = (L-p) Cia —qÿ"!+ 
+pCit "qi g) 7, J=0,1,2,...,k; 
Pfénsa = k+AE, = k} = p(- aq}. 
On remarquera que C?*! = 0, de sorte que P{£,,, = 0/£, = k} = (1-p}q". 

Pour & = 0 

Pés4n — 0/6, = 0} = 1-p, P{é,,, = 1/5, = 0} = p. 

Enfin pour k > mn 

Phi k-jfé, = k} = (ip) CagG-o)" ?+ 
+pCit'q tt j—=0,1,2,...,m, 
Ph = K+l/E, = k} = pig}. 
Si dans tous ces cas r > 1, alors 
Pr = K+ré, = k} = 0. 

Si m1 = 1, c'est-à-dire le système ne comporte qu’une seule station 
disponible, alors la chaîne {£,, #7 = 0, 1, 2, ...} est confondue avec celle 
de l'exemple 4 pour laquelle r, = 1—p, p, = p et pour x = 0 

Ps = PU —-Q), = qU-p},, Fr = (-p)(1-q)+pq. 


8.1.2. Propriété de Markov. Soit donnée une suite {&,, #7 = 0, 1, 2, ...} 
d'éléments aléatoires dans un espace mesurable (X, 3) (on admet que 
l'espace probabilisé (92, %, P) est fixé). Désignons par %, la plus petite tribu 
d'événements par rapport à laquelle sont mesurables les éléments aléatoires 
En En... & et par Ÿÿ” la plus petite tribu d'événements par rapport à la- 
quelle sont mesurables les éléments aléatoires &,, &,,,,... Autrement dit, 
S, cst la tribu de tous les événements rattachés à l'évolution de la suite 
jusqu'à la date # comprise, %" la tribu de tous les événements rattachés à 
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l'évolution de la suite après la date n, n compris. La tribu %, est engendrée 
par les événements de la forme {54 € 1°} pour tous les & = 0, 1,2,..., n, 
T'ES. De façon analogue, la tribu %" est engendrée par les événements 
ré, €l'}pour k => n, l'E D. 

La définition de la chaîne de Markov traduit donc le fait que pour tous 
les n = 0,1,2,...et "CD 


P{, 41€ 178) = P{én: 1 € TYE,} pes. 


Théorème 1, Soit {£,, n = 0, 1, 2, ...} une suite d'éléments aléatoires 
dans un espace mesurable (X, 8). Les propositions suivantes sont équiva- 


lentes : 
A) la suite {E,, n = 0, 1, ...} est une chaîne de Markov ; 


B) pour tous les n = 0,1,2,...,m=1,2,..., l'ES 
P{ôn4m € LDn) = Pénsm € Th} PS. ; 


C) quels que soient A EX, -,, BE" *! (n = 1,2,...) 
P{ANB/E,) = PA/E,} P(BJE) ps. : 
D) pour toute variable aléatoire n bornée ° *'-mesurable 
E(n/à.} = E{n/i,} ps. 


Si l’on considère que n est le présent, alors %, -, sera le passé et %"*! le 
futur. La proposition C) exprime donc le fait que pour une chaîne de Mar- 
kov le passé et le futur sont conditionnellement indépendants si le présent 
est connu. 


8.1.3. Equation de Chapman-Kolmogorov. Soit {6,, n = 0, 1, 2, ...} 
une chaine de Markov à valeurs dans un espace des phases (X#, 3), 
O0 = & < m < n. D'après les propriétés des probabilités conditionnelles et 
la propriété de Markov on a alors presque sûrement 


P(, € A} = E(P(, € LISE). 


Cette relation est appelée équation de Chapman-Kolmogorov. Elle découle 
de la formule des probabilités totales et de la propriété de Markov. 

Considérons la probabilité conditionnelle P{é, € l'/£,}, 0=k< n, 
l'E B. Cette probabilité est une fonction B-mesurable de £, pour k, net l 
fixes. Mais en général on ne peut pas affirmer que la fonction P{é, € l'/£,} 
est une mesure sur $ pour &, net « fixes. 

En effet, des propriétés des probabilités conditionnelles il s'ensuit que 
pour toute suite {/°, r = 1,2, ...} d'ensembles disjoints de la tribu 8, on 
a presque sûrement 


lie Ü ra} = Ÿ PET JE) 


rl ræl 


Ceci étant, l'ensemble des w pour lesquels cette égalité n'a pas lieu dépend de 
la suite {2°,, r = 1,2,...}). Si l’on considère une autre suite on obtiendra 
un autre ensemble exclusif, donc on ne peut pas affirmer que la probabilité 
conditionnelle P{£, € 7'/5,} est une mesure sur 8 pour presque tous les «. 

Cette proposition est toutefois vraie dans de nombreux cas. Notam- 
ment si À est un espace séparable métrique complet (c'est-à-dire un espace 
polonais) et 8 la tribu des boréliens de X, il existe alors une fonction 
P(,x,n,1%,0-=k<n.\xexX, TER, telle que pour tous &, net ZJ'ona 
presque sûrement 


P{E, € lYE) — PC, &,n, 1), 


où P(K, x, n, l') est W-mesurable pour &, n, fixes, et est une mesure pro- 
babiliste sur # pour £, v, fixes. Il est évident que pour À = non doit avoir 
Pt, x,n, 1) = 77 (x), où 77-(x) est l'indicateur de l'ensemble /". 

Si la fonction P(K, x, #, 1") existe pour une chaîne {£,, # = 0, 1,2, ...} 
donnée dans l'espace (X, %), on l'appelle alors probabilité de passage. En 
termes de probabilités de passage l'équation de Chapman-Kolmogorov 
peut s'écrire : 


PR, &n, 1) = | PO, y, n, l') PK, &, m, dy). 
X 


Cette égalité a presque sûrement lieu. Souvent on a affaire à l'égalité plus 
forte 


PK, x, n, 1) — Î PGm, v,n, l')P(K, x, m, dy) 


\ 


pour tous les 0<k <=mn,xe€ X, l'E, appelée également équation 
de Chapman-Kolmogorov pour les probabilités de passage. La probabilité 
de passage P(K, x, n, 1") peut être interprétée comme la probabilité condition- 
nelle P{E,€ 17, = x}. 

On remarquera que les probabilités conditionnelles de la forme 
P{£,€ 1/5, = x} pour une suite aléatoire donnée {5,, n == 0, 1,2, ...} 
peuvent satisfaire l'équation de Chapman-Kolmogorov sans que cette 
suite soit chaîne de Markov. 

Exemple 6. Une urne contient 4 boules portant respectivement les 
numéros 1, 2, 3 et 4. On tire une boule au hasard, on note son numéro puis 
on la replace dans l'urne. Supposons que cette opération est répétée aussi 


longtemps que l'on veut. Désignons par », le numéro de la boule tirée au 
n-ième pas. Soit 4}, j : 1, 2, 3, l'événement : », — j ou 7, = 4. Posons 
Es +3 0 7 1,2,..., égal à 1 ou O selon que l'événement 4," est 
réalisé ou non. Alors, pour x,, x, €t V2, égaux chacun soit à 0 soit à l,on a 


Q - LS | 
PSE RSRPES sale > Um 


= 
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Par suite, pour & — »1 < nona 


Le PE = xt = a) = PA = axé = 0) PE = Of = x1)+ 


2 
+ PE, = x, = 1) PE, = Ib = x), 


c'est-à-dire l'équation de Chapman-Kolmogorov cst réalisée pour les pro- 
babilités conditionnelles. Cependant 


Pan is = Es 2 5 1, AE DE 1} — 1, nm) — l, 2, ... 


donc la suite {£,, # = 1,2, ...} n’est pas chaine de Markov. 
8.1.4. Construction d’une chaîne de Markov à l’aide d’une probabilité de 
passage. Soit (4, %) un espace mesurable. Supposons que pour tous les 
xEX, TES et des k, n entiers tels que 0 =& À < nest donnée une fonction 
numérique P(K, x, n, 1") vérifiant les conditions suivantes : 

a) P(K, x, n, 1") est B-mesurable pour k, n, [fixes ; 

b) P(£, x, n, l')est mesure probabiliste sur 8 pour K, x, n fixes ; 


C) P,x,n, 1) — [ Pt, x, m, dy) Pm, y, n, 1) 
x 


pour tous les 0 & £ <m<n,xe€Xet l'E VW. On demande s'il existe sur 
un cspace probabilisé ({, %, P) une chaine de Markov {£,,n = 0, 1,2, ...) 
pour laquelle P(K, x, n, [°) soit probabilité de passage, c’est-à-dire si 


P(,€175}) = P(K, &, n, 1") ps. 


La réponse se trouve dans le théorème suivant. 

Théorème 2. Si une fonction P( K, x, n, 1”) vérifie les conditions a), b) et c), 
il existe un espace probabilisé (9, %, P) et une suite {£,, n = 0, 1,2, ...} 
d'éléments aléatoires de (X, 8) tels que la suite {£,, n = 0,1,2, ...}est une 
chaîne de Markov de probabilité de passage P(K, x, n, 1"). 

L'espace probabilisé du théorème 2 peut être construit de la manière 
suivante. Posons £2 = X°°, ÿ = 4”. Ceci exprime que les éléments de 
l'ensemble {2 sont les suites de la forme w = (vo, Xi Ve, ...) OU NE XetŸ 
est la plus petite tribu des parties de £2, de la forme 


{o: x Elo NE ln ..., NE 1) (1.2) 


quels que soient # = 0, 1,2,...1,1",..., 1, EN. 
Soit par ailleurs # une mesure probabiliste sur #. Sur les ensembles 
(1.2) définissons la fonction numérique P par 


P{w : Vo € D, AN" el", .….. AY" C 1°} — 


= [atdxe) [ PO, vo, 1, dx) [ PQ, vi, 2, dxs) ... X 
l' 1", l 


X Î PGu—-1, x, 1, dx). 
lu 
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Cette fonction cest prolongeable à la mesure probabiliste P sur l'espace 
mesurable ({2, %). Posons &, = &, (0) = x,, n# = 0, 1,2,..., où «w = 
= (Ko Vin Xa ...). La suite {£,,n = 0,1,2, ...} d'éléments aléatoires dans 
(X, 3) forme alors sur l'espace probabilisé (9, ÿ, P) une chaine de Mar- 
kov pour laquelle la fonction donnée P(k, x, n, ES est probabilité de pas- 
sage. Ceci étant, l’état initial £, admet une loi x appelée loi initiale de la 
chaine. 

Ilest évident que la fonction P(E, x, n, l’}ne définit pas une seule chaîne 
de Markov : il existe un arbitraire dans le choix de l’espace probabilisé et de 
la répartition initiale. Cependant, si les probabilités de passage et les lois 
initiales des deux chaines {£,, n — 0, 1, 2,...} et {&%, n = 0, 1, 2,...) 
définies respectivement sur les espaces probabilisés (0, #, P) et (42, 9’, P’), 
et à valeurs dans un même espace des phases sont confondues, alors ces 
chaines sont stochastiquement équivalentes en ce sens que 


PH Cl El el = PEL HER. EE) 


pour tous x = 0, 1, 2, ... et pour toute collection {7°, i = 0, 1, 2,..., n} 
d'ensembles mesurables de l'espace des phases. Ceci revient à dire que la 
chaine de Markov est définie de façon unique par sa probabilité de passage 
ct sa loi initiale. 

8.1.5. Autre définition de Ia chaîne de Markov. Soicnt donnés un espace 
probabilisé (9, %, P) et une chaine de Markov {,, n — 0, 1, 2, ...} définie 
sur (9, %, P)et à valeurs dans l'espace des phases (X, Ÿ). Supposons que la 
probabilité de passage de cette chaine remplit les conditions, a, b et c du 
n° 8.1.4. Alors, quels que soient k = 0 et x € X, sur la tribu %* engendrée 
par les éléments aléatoires £,, 5, , ,,... sont définies des mesures probabilis- 
tes P,, telles que P,: (4) = P{A4/3,} p.s. pour 4 € (on rappelle que 
4 est la tribu engendrée par les éléments aléatoires £,, £., ...,€&,). Donc 
P,,(4), AE X%!, définit la probabilité conditionnelle de l'événement 4 
sachant que £, = x. En particulier, la probabilité de passage de la chaîne est 
donnée en fonction des mesures P,, par 


PE x un, 1)=PAELETT 0<k<n, xXEX, lEY. 


Par chaine de Markov on entend parfois l'ensemble d'objets suivants: 

1) un espace mesurable (4, 7) ; 

2) une suite Cr = &, (w), n = 0, 1, 2,...} d'applications mesurables 
pour chaque #1 de l'espace (2, %) dans un espace mesurable (#, 5) ; 

3) une famille de mesures probabilistes P,, (£ sont des entiers non 
négatifs, x € X), définies sur les tribus %° & % sous réserve que soient 
réalisées les conditions suivantes : 

a) la fonction P(K, x, n, 1") =: P,,(5, € l'}est -mesurable pour &, net 
l'fixes,0<k<n, TEW;: 

b) P, {i, € 1} = 4p (x) ; 

c) pour tous les x € #,0 «= & — net l'ES on a P,, presque sûrement 


P,.{5, ti € l'TR,} TT Pie {ss tu € 1}. 
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Siest donnée une chaine de Markov au sens de cette définition, alors en 
posant 


PP(A4)= [P,(A4)u(@dx), AE, k=0,1,2,..., 
X 


pour toute mesure probabiliste y, définie sur (4, 8), on obtient une suite 
Ep Éktu kr ... d'éléments aléatoires à valeurs dans (#, 3), définie sur 


l'espace probabilisé (9, 3’, Po} et formant une chaîne de Markov au sens 


de la définition donnée au début du n° 8.1. 

Donc, une chaine de Markov au sens de la dernière définition est une 
famille de chaines de Markov (au sens de la première définition) « débutant » 
à la date K au point x. 

La fonction P{&, x, #, 1") définie dans la condition a) est dite probabilité 
de passage de la chaine. 

Deux chaînes de Markov (au sens de la dernière définition) à valeurs 
dans un même espace des phases sont équivalentes si leurs probabilités de 
passage sont confondues. Des chaines de Markov construites au sens de la 
première définition à partir de chaînes équivalentes avec la même loi initiale 
ct le même instant initial seront stochastiquement équivalentes. 

A noter que toute fonction P(£, x, n, [") vérifiant les hypothèses du théo- 
rème 2, définit une chaîne de Markov au sens de la dernière définition. 


8.2. Chaînes de Niarkov homogènes 


8.2.1. Définition d’une chaîne de Markov homogène. Soit donné un espace 
probabilisé (9, %, P). On dit qu'une chaine de Markov {£,,n = 0,1,2, ...}) 
à valeurs dans un espace des phases (#, ) de probabilité de passage 
P(&, x, n, 1") est homogène si P(&k, x, n, 1") est une fonction de x € #, 
l'EB et de n—-k, 0 = k& < n. Désignons par P(u,x,l), n—0,xE€eX, 
l'E 3 une fonction telle que 
PK, x, n, 1) = P(n-—k, x, D”. 

Pour n = 0 il est naturel de poser P(0, x, [) = 4,{x). La fonction 
P(n, x, 1°) s'appelle probabilité de passage de la chaine homogène. D'après 
le numéro 8.14 elle satisfait les conditions suivantes : 

a) la fonction P{u, x, 7’) est B-mesurable pour x et 7” fixes, n — 
= 0,1,2,...,7€Y;: 

b) la fonction P(n, x, /') est mesure probabiliste sur 8 pour net x fixes, 
n=— 0,1,2,...,NEX; 

c) pour tous les 0 = &£ = m = net l'E 8 on a presque sûrement 


P{u-k, &, 11) = Î PGa—m, », L') POn-Kk, à, dy). 
X 


On admettra plus bas que la probabilité de passage d’une chaîne de 
Markov homogène vérifie les conditions a), b) et la condition c bis) suivante 
qui est plus forte que la condition c) : 


16$ 


c bis) pour tous les m1 > 0, n => 0, x € et l'C M est réalisée la rela- 
tion suivante 


P@n+n, x, l')= [ Pn, x, dy) P(n, y, P), 
x 


appelée équation de Chapman-Kolmogorov. 

Posons P(x, 1”) = P(1, x, D). La fonction P(x, Z')est appelée probabilité 
de passage en un pas. De l'équation de Chapman-Kolmogorov il s'ensuit que 
la probabilité de passage en #1 pas, c'est-à-dire la fonction P{u, x, T) s'expri- 
mc en fonction de P(x, l')"par les relations de récurrence 


P@+1,x, 0) = ([PG,r, D) PQ, dy) = 
AG 

S fP6, l”) PG, Y, dy), nn — 1, 2; ... 
x 


Si donc l'on connait la loi initiale x d’une chaîne homogène (c'est-à-dire la 
mesure y (1°) = P{é, € 1}, l'E 8) et la probabilité de passage en un pas, 
on peut en principe déterminer la probabilité d’un événement quelconque 
lié à l'évolution de la chaîne considérée, c’est-à-dire un événement quel- 
conque de la tribu %° engendrée par les éléments £,, £,, £,, .... Plus 
exactement, pour les événements de la forme 


AVESNES nes less EN 


on à 
P(4) = f dx) f P(Xo dx) Î Pr dx, 0) PO, PO. 
rs Fr, 


Les événements de la forme indiquée constituant une algèbre, ct %° étant 
la plus petite tribu engendrée par cette algèbre, la probabilité de passage 
d'un événement quelconque de %° est déterminée de façon unique par les 
probabilités de tous les événements du type 4. 

Il s'ensuit que toutes les chaines de Markov homogènes à valeurs dans 
un même espace des phases (définies éventuellement sur des espaces pro- 
babilisés différents) ayant les mêmes lois initiales et les mêmes probabilités 
de passage en un pas sont stochastiquement équivalentes. Ceci exprime que 
les probabilités des événements de type À sont les mêmes pour de telles 
chaines. 

La probabilité P(x, 1°), x E X, l'E de passage en un pas satisfait les 
conditions : 

A) la fonction P(x, l')est B-mesurable en x pour L'E B fixe ; 

B) la fonction P(x, l') est mesure probabiliste sur 8 pour x € X fixe. 

Si une fonction P(x, 7"), xE X, l'E B vérifiant les conditions A) et 
B), est donnée sur un espace mesurable (X,5), on peut construire une 
chaine de Markov homogène admettant cette fonction pour probabilité 
de passage en un pas. Il est évident qu'il existe plusieurs chaînes possédant 
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cette probabilité de passage en un pas. Cependant ces chaînes ne diffèrent 
l’une de l’autre (à l'équivalence stochastique près) que par leur loi initiale. 
8.2.2. Autre définition d’une chaîne de Niarkov homogène. Quand on étudie 
des chaînes de Markov homogènes on a intérêt à ne pas fixer la loi initiale 
mais à considérer toute une famille de chaines homogènes « débutant » en 
un point non aléatoire de l’espace des phases. Soit {£,, # = 0, 1, 2, ...} 
une chaîne de Markov homogène à valeurs dans l’espace des phases (4, 5), 
définie sur l'espace probabilisé (9, %, P). Pour tout x € X on peut cons- 
truire unc famille de mesures P, sur la tribu %° engendrée par les élé- 
ments aléatoires &,, £,, ..., en les donnant sur les événements de la 
forme 4,(D, 1, ..., 19) = {0€ To, €, ..., 8, € T,} par la formule 


PA (To lis LY= 4709 Ÿ P(R dx) 
r’ 


J P(Xs-2 dx) P(X, 1 1), 


Ph: 
ct prolonger ensuite P, à une mesure sur %°. Si AE, alors Pe, (A) — 


= P(A/E) p.s. Donc P,(4), 4€ %°, x E X, s'interprète naturellement 
comme la probabilité conditionnelle de l'événement 4 sachant que &, = À. 
Si &, admet la loi 4, la restriction de la mesure P à la tribu 3°(%° € ®) 
cst confondue avec la mesure 


P,(4) = J 1(dx) P,(4), À € D. 


La famille de mesures {P,, x € X} construite sur %° jouit des pro- 
priétés suivantes : 

D) la fonction Pa, x, 1) = P,{6,€ l"} est W-mesurable pour 7€ 3 
ct u = 0, 1,2, ... fixes ; 

2) P,{6 € l'}:= 1), X EN, l'E ; 

3) la relation 


PH vu CIE.) = Pa {€} 


cst P;-presque sürement réalisée pour tous les x € 4, l'E ct n,m = 
=0,1,2,.:..:ù représente à ici la plus petite tribu par rapport à laquelle 
sont mesurables les éléments # AR RS DE 

Par chaine de Markov homogène on cntend parfois la collection 
d'objets : 

a) une suite {&, = &,(w), n = 0, 1, 2, ...} d'applications mesurables 
d'un espace mesurable (9, %) dans un espace mesurable (X, 3); 

b) une famille de mesures probabilistes {P,, x € X} définies sur la tribu 
g° engendrée par les éléments aléatoires &,, &,, £,, ... si sculement sont 
réalisées les conditions 1) à 3). 

Ainsi définie, la chaîne de Markov homogène à valeurs dans l’espace 
des phases (X, 8) sera désignée par (£,, P,). En fait c'est toute une famille 
de chaînes de Markov homogènes dans la définition initiale. Pour obtenir 
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une chaine de Markov homogène avec une loi initiale y fixe, il faut con- 
sidérer une suite {£,, » = 0, 1,2, ...} sur un cspace probabilisé (Q, %°, P,,), 


où 
P,(4) = f a{4x) P,(4), 4 € %°. 
x 


Deux chaines de Markov homogènes (£,, P,) et (£,, P:) à valeurs dans 
un même espace des phases (définies éventuellement sur des espaces pro- 
babilisés distincts) sont équivalentes si pour tous les x € X, l'E 


P,(6,€1% = PA CT. 


On remarquera qu'étant donnée une fonction P(x, 7") vérifiant Îles 

conditions A) et B) du n° 8.2.1 on peut toujours construire une chaîne de 
Markov (Ë,, P,) pour laquelle P,{£, € 7} = P(x, 1”), cette chaîne étant 
unique à équivalence près. 
8.2.3. Conséquences de la propriété de Markov. Soit (£,, P,) une chaîne 
de Markov homogène à valeurs dans l'espace des phases (X, 8) au sens de 
la définition du n° 8.2.2. Définissons sur la tribu %°, engendrée par les 
éléments aléatoires &,, £,, ..., une famille d'opérateurs 0,, k = 0, 1,2, ..., 
envoyant %° dans %° de la manière suivante. Posons 


0€} = (6,12€) 
pour les événements de la forme {£é,€ 1”}, n = 0, 1, 2, ..., 1'E%. On 


exigera de plus que les opérateurs 0, conservent toutcs les opérations 
ensemblistes, c'est-à-dire pour tous les 4, € 4° 


0, te 4 = U UE Pr 0, fn 4} —= (] EE Pr 
0,(4,\4;) — 0,4;\0s A5. 


Ceci définit les opérateurs 0, de façon unique. 
Si AE, alors 0,4 €%*, où ®%* cest la tribu engendrée par les 


éléments &,, &,,,,... Les propriétés de Markov et d'homogénéité entraînent 
que pour tous les 4€ #°,x E X,k = 0,1,2,... on a P,-presque sûrement 
P,{0,4 [&} P:,(4), (2.1) 


où %. est la tribu engendrée par les éléments &,, £,, ..., &,. D'une façon 
générale, si 7 € 1, À € °, alors pour tous les x € X on a 


P,{BN0,4} = ! P,,(4) P (do). (2.2) 


Les opérateurs 0, peuvent être appliqués aux variables aléatoires. Posons 
n = 0,Ë, où Ë est une variable aléatoire %°-mesurable, si pour tous les a 
récls 

O{Ë = a} = (7 = a). 
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Si £ est X°-mesurable, alors /Ë est À'-mesurable. Les relations (2.1) 
ct (2.2) entrainent 


LASER} = Es: 
E {5} = EÂNEcié}, 


où à est une variable aléatoire ÿ°-mesurable, 7 une variable %,-mesurable, 
E, l'espérance mathématique par rapport à la mesure P,, k = 0, 1,2, .... 
La première de ces relations a lieu P,-presque sûrement si l'on exige natu- 
rellement que à soit P,-sommable. Pour que la deuxième relation soit 
réalisée, il suffit que les variables = ct »/,i soient P,-sommables. 

Si & et 7 sont non négatives, les deux relations sont valables sans condi- 
tions supplémentaires. 


8.2.4. Propriété de Murkov forte. Soit (&,, P,) une chaine de Markov 
homogène à valeurs dans l'espace des phases (Y, 8). Si£, figure la position 
d'une particule mobile à l'instant », la formule (2.1) exprime que le mouve- 
ment recommence à chaque instant fixe. 

I s'avère que cette propriété caractérise aussi certains instants aléa- 
toires. Supposons que %, k = 0, 1, ..., désigne toujours la plus petite 
tribu d'événements engendrée par les éléments &,,£,, ..., &, et %°, & = 
= 0,1,2,...,la plus petite tribu d'événements engendrée par les éléments 
aléatoires &,, £,,,, .... On dit qu'une variable aléatoire 7 entière non 
négative généralement impropre (c'est-à-dire pour certains « éven- 
tuellement 7 (m) — +) est un temps d’arrêt ou instant markovien si pour 
tout n = 0, 1,2, ... l'événement {r = n} est Y,-mesurable. Ceci veut dire 
que si l’on veut savoir si l'événement {7 = n} s'est bien réalisé il faut 
«suivre » l'évolution de la chaine seulement jusqu'à l'instant # compris. 
On remarquera qu'exiger que {r=n}e®, revient à exiger que 
{r = n}EY, pour tous les # ou encore que {r =: n}€ X, pour tous les %.. 

Soit 7 un temps d'arrêt pour une chaîne de Markov homogène 
(£,, P,). Désignons par %, l’ensemble de tous les évènements 4 € %°, tels 
que Air = n}€ %, pour tous les n# == 0, 1, 2, .... Alors À, cest une tribu 
d'événements. Cette tribu contient les événements dont on peut dire s'ils 
ont cu lieu ou non en étudiant l'évolution de la chaine seulement jusqu'à 
un instant aléatoire r. 

Un exemple élémentaire de temps d'arrêt r est l'instant fixe (non aléa- 
toire) #. Pour lui %, cest confondue avec %.. 

Un autre exemple de temps d’arrêt nous cest fourni par le temps 
d'entrée dans certains ensembles. Soit 7° un ensemble mesurable d'un 
espace des phases. Posons r := inf{k:£,€ ['}; nous admettrons que 
T(w) = + si pour w donné Ë,(w) & 1’ pour tous les k = 0, 1,2,... Sous 
ces conditions 7 est un temps d’arrêt appelé temps d’entrée dans l’ensemble 7”. 

On remarquera que si r est un temps d’arrêt pour une chaîne de Markov 
homogène (£,, P,), alors la variable r est %,-mesurable. Si, par ailleurs, 
T < +o P,-presque sûrement pour tous les x € X, alors l'élément aléa- 
toire £,est aussi %.-mesurable. Ici ë, = &,4.,(w) = £,(w) pour « € {r = n}. 
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Toute chaine de Markov homogène (é,, P,) à valeurs dans un espace 
des phases (Y, 8) jouit de la propriété de Markov forte suivante : pour 
tout temps d'arrêt r et tous entiers > 0,1 € X, l'EB 


Pésr ET /8r) = PO, &,, 1) 


P,-presque sûrement sur l'ensemble {r < + }. P(n, x, 1") est la probabilité 
de passage en n pas, c'est-à-dire P(n, x, 1") = P{#,€ 7. 

La propriété de Markov forte indique que pour un état fixe &, à un 
temps d'arrêt r la suite {£,,,, n = 0, 1, ...} est une chaine de Markov 
homogène d'état initial £,, possédant les mêmes probabilités de passage 
que la chaîne initiale et ne dépendant pas de la tribu Y.. En d’autres termes, 
si rest un temps d'arrêt pour la chaîne (é,, P,) et r = + ©, alors la particule 
qui se trouve dans l'état &, à l'instant # se remet en mouvement à l'instant r. 

Soient donnés une chaine de Markov homogène (#,, P,) à valeurs dans 
un espace des phases (X, 8) et un temps d'arrêt 7. Pour tout 4€ ÿ° 
posons 


0,4 = U {r = n}N0,4A 


ñn=0 


et pour toute variable aléatoire %°-mesurable £ 
0,5 = 0, E(o) 


si T(o) = n. Alors 
a) pour tous AE ÿetxe X 


P,{8,4/3;} = Pa. (4) 
P,-presque sûrement sur l’ensemble {r < +}; 
b) pour tous 4€ %°, BE etxE X 
P{BN0,A} = | P4,(4) P,(do) ; 
B 


c) si 7 est une variable aléatoire %°-mesurable P,-sommable, alors 
E,{0,17/3,} = E, 7 


P,-presque sûrement sur l'ensemble {T < +co) ; 
d) si 7 est une variable aléatoire %°-mesurable ct ? une variable aléa- 
toire Y,-mesurable, alors pour tous les x € X 


E, {00,1} = E{CE,,1} 


sous réserve que les variables 7 et 0,7 sont P.-sommables, x € X. 
Si n et & sont strictement positives, alors c) et d) sont réalisées sans 
restrictions supplémentaires. 


8.2.5. Opérateurs rattachés à une chaîne de Markov. Soit (£,, P,) une 
chaîne de Markov homogène à valeurs dans un espace des phases (X, 8), 
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de probabilité de passage en un pas P(x, 7"), x € Y,1"€ %. Désignons par 
l’espace de Banach de toutes les fonctions réelles s-additives à variation 
bornée (des charges), définies sur la tribu %, de norme égale à la variation 
d’une charge, ct par Ÿt l’espace de Banach de toutes les fonctions réelles 
$-mesurables, définies sur X, de norme égale au supremum du module 
de la fonction. Le noyau P(x, 1°) engendre des opérateurs sur les espaces 
A et D agissant d’après les formules 


FP()= fPG,T)pdx), peu l'EB; 
x 

PIX) = [/O)P(, dy, SEM, xEX. 
Z 


Ces deux opérateurs sont linéaires, continus et possèdent des normes 
inférieures à un. De plus, ils sont positifs en ce sens que x P = 0 pour 
u=0et Pf> 0 pour f > 0. Pour € { et SE D posons 


{, ND) = [SG r@x). 
x 


On a alors (qP, f}) = (y, Pf) pour tous les pE À ct SE D. 


Désignons par P* la puissance #-ième de l'opérateur P. L'équation de 
Chapman-Kolmogorov entraîne 


PQ = [SO)PQ, x, d)=EfE)  n=1,2,.., XX, [EM ; 
x 
PPT) = Î PQ, x, rx) = [rx PAS ET, n = 1,2,..., 
x X 


T'EB, peu; 
(eP», [) = (y, PJ) = [otdx) Î PQ, x, dy) fO) = [dE SE). 
x x z 


Pour nr = 0 convient que P° = 7, où est l'opérateur identité. 


Il est évident qu'on peut appliquer l'opérateur P aux fonctions 8- 
mesurables indéfinies ainsi qu'aux charges à variation indéfinie, pourvu que 
les intégrales définissant cet opérateur aient un sens. 

On dit qu'une fonction réelle B-mesurable (x), x € X, est super- 
harmonique (resp. subharmonique) si pour tous les x € X on a P/(x) = f(x) 
(resp. Pf(x) = f(x). Si pour tous les x E X, on a f(x) = Pf(x), alors 
f(x) est harmonique. Une fonction superharmonique non négative est dite 
excessive. 

Une charge (généralement à variation indéfinic) est invariante si 
pP = p. Une mesure invariante finie y (autrement dit, une charge inva- 
riante non négative à variation bornée) est par définition stationnaire. Une 
mesure stationnaire peut toujours être normée et considérée comme pro- 
babiliste. Si pour une chaîne donnée (£,, P,), il existe une mesure station- 
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naire y, alors en prenant cette dernière pour loi initiale, c’est-à-dire en 
posant P{£, € 7°} = (T°), on aura 


P,{,€ 1} = Î u(dx) P,{Ë, € 1} = a P"T) = (D), 
x 


n=0,1,2,..., l'ED. 


Donc, la loi de l'élément &, par rapport à la mesure P, est invariable dans 
le temps. Bien plus, pour 0 æÆ y, < n;, < ... < nm, T,, T,, ..., 1€, 
r=0,ona 


La CAROL T ET Entre € Ta ..., Enr ET :} — 
= [udxs) Î POu+r, Xo dx) [ PO, x1, dx) … 


x 7 T7 
… [P(Rm-m- 1 Va-1n dXr) = J'atxo) Jr Xo dx) X 
Te 
X f PG@s:-n, X1s dXe) fran Xe- 1 dXa) = 
"M Tr 


Pie CNE ÉD sut el) Er. 


Ceci exprime que la suite {£,, n = 0, 1, 2, ...} à valeurs dans l’espace des 
phases (X#, 8), définie sur l’espace probabilisé (9, $°, P,), est une suîte 
stationnaire. 

Donc, si pour une chaîne donnée il existe une mesure stationnaire, 
alors en prenant cette dernière pour loi initiale, on obtient une chaîne 
stationnaire de Markov. 


Définissons l'opérateur G = Di Ps, Cet opérateur est appelé potentiel 

de la chaîne. Il est clair que cet ohéraieu n’agit pas sur toute fonction B- 

mesurable | par exemple, pour / (x) = 1, on a G/(x) = ÿ PAf(x) = + æ) | 
n=0 


Il peut arriver, en particulier, que son domaine de définition ne soit composé 
que de la seule fonction f(x) = 0 
Posons 


G(x, T°) = Gx{x) = > Pr) = ÿ P{n, x, D), 


xEX, l'EB. Pour xE X fixe, G(x, -) est une mesure sur B, éventuelle- 
ment identiquement égale à l'infini. La fonction G(x, 7”), s'appelle noyau 
du potentiel. Si G|/1|(x) <<, où (x), x € X, est une fonction B-mesura- 


bic, alors 
Gf(x)= [f0)G(x, dy). 
zx 
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Le noyau du potentiel admet une signification probabiliste simple. 
Comme Pn, x, 1”) — E,Zr(S,), alors 


GG DN2E, E 4) 


c'est-à-dire G(x, l') est la moyenne des instants pendant lesquels le système 
s'est trouvé dans les états de l'ensemble /” sachant qu'à l'instant initial il 
était en x. 

Soient (x) = 0 ct gx) = Gf(x) < +, x E X. Alors (P—1)r = —f, 
où Z est l'opérateur identité. La dernière relation exprime que l'opérateur 
G est l'inverse de l’opérateur 7 — P dans un certain sens. Elle entraine égale- 
ment que le potentiel d’une fonction non négative est excessif. Inversement, 
si f(x), x € X, est une fonction excessive, alors f(x) = Gr(x)+/A(x), où 
g(x) > 0 et A(x) est une fonction harmonique, c'est-à-dire 4 = Ph. Cette 
assertion est l’analogue du théorème classique de Riesz en théorie des 
équations différentielles. 

Exemple 1. Soient X un réseau entier sur la droite, 3 la tribu des 
parties de X. Soit donnée une suite {»,, » = 1, 2, ...} de variables aléa- 
toires indépendantes identiquement réparties et à ‘valeurs dans X. Si 2} 
est une variable aléatoire à valeurs entières ne dépendant pas de la suite 
{n,, n = 1}, alors la suite {£, = 7,+,+ ... +9, n = 0, 1, 2, ...} forme 
une chaîne de Markov homogène (une promenade aléatoire sur un réseau 
à valeurs entières). Posons 


g(@0) = Een, O€ER!. 
La probabilité de passage en # pas est justiciable de la formule 
7 
P(u, x, ») = _ Î er 9g»(0) dU, n=0,1,2,..., \,YEX. 

EL 
A noter que la tribu $ étant constituée de toutes les parties de X, il suffit 
de connaître P(n, x, y) pour tous les x, y € #, puisque pour °C Xona 

Pa, x, l')= Ÿ PU, x, y). 
cr 

Supposons par ailleurs que (0) prend la valeur 1 uniquement aux points 


multiples de 27 et que l’espérance mathématique de 7, À = 1, 2, ..., 
existe et a = Er, # 0. Pour le noyau du potentiel on a alors la formule 


1 . elxs-») 
G(x, ») = ) P(u, x, ») Sal 27 I" ---  dÙ = 
n=0 dé 


T2 J M=7O (Us AE, 
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où 7,(9) = Re 7(0), g,(0) = Imy(0). En particulier, si 9,, & = 1, 2, ..., 
ne prennent que les valeurs + 1 et — 1 respectivement avec les probabilités 
pag p+g= 1,p-g= a => 0, alors 


I 
=. our >= X 
: P à 


Te ME TE 
a \l+a P Fr 


G(x, y) = 


8.2.6. Interprétation probabiliste de la solution du problème de Dirichlet. 
Soit P(x, Z') la probabilité de passage en un pas d’une chaîne de Markov 
homogène à valeurs dans l’espace des phases (Y, 8). On dira qu'une fonc- 
tion réclle f(x) B-mesurable, définie sur X, est harmonique sur un ensemble 
T'ES si f(x) = Pf(x) pour tous les x € T°. 

Le problème suivant cest l'équivalent du problème de Dirichlet en 
théorie des équations différentielles. 

Soient donnés un ensemble D € 3 et une fonction g(x) réelle 3- 
mesurable définie sur l'ensemble #\D. On demande une fonction f(x) 
%-mesurable harmonique sur D et coïncidant en dehors de D avec une 
fonction g{x) donnée. 

Il est aisé d'exprimer la solution de ce problème en termes probabilistes. 
Soit Tr le premier temps d'entrée dans l'ensemble X\D pour une chaine 
de Markov de probabilité de passage en un pas P(x, l'): T=inf{u: n>0, 
E, € D} ; sië,(o) € D, Yn = 0,1,2,... pour un certain w, on conviendra 
que T(«) = +. Posons / (x) = E,z(é,) pour tous les x € X. Si, de plus, 
T = +o, on admettra que g(£,) = 0. Il est immédiat que / (x) = g(x) 
pour x & D. On vérifie de même sans peine que /(x) est harmonique sur 
l'ensemble D. 

D'une façon générale, la solution de ce problème n'est pas unique. 


8.2.7. Fonctionnelles d’une chaîne de Markov. Soit (£,, P,) une chaîne de 
Markov à valeurs dans l'espace des phases (4, 3). Posons 


m = D th), 


£:0 
où vx), x € X, est une fonction réelle W-mesurable. La variable aléatoire 
7, est une fonctionnelle de la chaine de Markov (&,, P,). Ceci exprime que 


m est &,-mesurable. 
La loi de la variable »}, est définie si l'on connaît la fonction 


uAx, L'; 2) = ) E {e "/5, € l'} Pau, x, 1°)", 
n=0 


où x e X, l'E B, 0 et À sont des réels, 0 = 0 < 1. 
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On démontre que la fonction #9 est la seule solution des deux équations 
intégrales 


uglx, L'3 2) = Polx, 1')+ [(—-e 4) ur, L'; À) Polx, dy) ; 
x 


où 
ur, T3 2) = Pix, T4 [ Gen) Pt, TJ ug(x, dy ; à), 
z 


où 
Ph, l)= S'OPGX, D), xEX, l'E, 0<0<1. 
n=0 


De telles équations peuvent être utiles dans l'étude du comportement 
de 7, pour 1 — co. En particulier, il peut s'avérer que 


7 = D. v(É,) < co. 


Ce sera le cas si par exemple 


(| [vO)| G(x, dy) <= æ, 
x 


où G(x, l')est le noyau du potentiel de la chaîne. En posant 
u(x ; À) = Ee, 
on obtient pour la fonction «(x ; À) les équations intégrales 
u(x ; À) = en [ PC, dy) u(y ; À); 
x 


u(x ; À) = 1+ f (1—e- 4) (y À) G(x, dj), (2.3) 
x 


où P(x, [")est la probabilité de passage en un pas. 
Excemple2. Supposons que # est dénombrable et soit 8 la tribu 
des parties de X". Posons 


w - | 1 pour y = Yo; 


0 pour }Y# Jo 
où y, € À. La quantité M, = > v(é,) est alors le nombre d'instants pen- 


n=0 
dant lesquels la chaîne cst dans l'état y, entre les dates 0 et + co. Si l'on 
admet que G{(y0, yo) < ©, l'équation (2.3) s'écrit 


u(x ; À) = 1+(1—e-4) uGye ; À) G(x, po). 
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De cette équation on déduit que 


: C_c | 
HS) EE 
d d 1-d(1-e-") 


où c = G(x, yo), d = GO, po), © = d. D'où 


P,{n,. ee 0} = 1 , 


Pr, =n}=< DT, n=1,2,..., xEX, 


c'est-à-dire m,, suit la loi géométrique. De plus, E,r,, = G(X, Jo): 


8.2.8. Théorèmes limites pour chaînes de Markov. Soit donnée une chaine 
de Markov (£,, P,) à valeurs dans un espace des phases (X, 8). 

Il est important de savoir comment se comportent les probabilités 
P(n, x, 1) pour n-+>c. Au numéro 8.3 ce problème fera l’objet d’une 
étude approfondie pour le cas où l'ensemble X est dénombrable ou fini. 
On exhibe ici les principaux résultats pour le cas général sous réserve 
que soit réalisée la condition de Dôblin que nous appellerons condition (D) 
dans la suite. Formulons-la. 

Condition (D). Il existe une mesure finie y sur la tribu 9 (qg{X) > 0), 
unentier k, = 1 et un nombre positif e tels que 


P(ko X, T) = l]—Ee 


pour tous x € X et l'E Btelquez(]) < €. 

Voici quelques exemples de chaînes de Markov satisfaisant à la con- 
dition (D). 

a) Considérons une chaine de Markov dont l'ensemble des états est 
fini. En posant g{1”) égal au nombre de points de l'ensemble 7°, on aura 
T'= G si seulement g(7”) < 1. Donc, pour g(7”) < 1 on a P{n, x, 1) = 0, 
et la condition (D) est remplie. Par suite, la condition (D) n'est pas restric- 
tive pour les chaînes de Markov finies. 

Si l’ensemble des états est dénombrable, la condition (D) est réalisée, 
par exemple, dans le cas où la série 5 P(x, >) converge uniformément 


Ex 
en xE X, P(x,}y) étant la probabilité de passage de x en y en un pas. 
Cependant la condition de convergence uniforme de cette série cst bien 
plus forte que la condition (D). 
b) Soient X un borélien dans R", $ la tribu des boréliens de X. 
Supposons qu'existe une fonction borélienne p{x, y) de deux variables 
X, € X'telle que 


P&T)= fx »dy, xex, TES. 
r 
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De toute évidence r{x, ») :- Oct 


[pex, ») dy = 1. 
x 


Dans ce cas la condition (D) est remplie si, par exemple, mes X < < et la 
fonction p{x, y) est bornée ou intégrable par rapport à y uniformément en x. 
Cependant ici aussi ces deux conditions sont bien plus fortes que la condi- 
tion (D), puisqu'elles entrainent la convergence uniforme en x de P(x, 1") 
vers O0 pour mes Z°— 0 alors que la condition (D) exige seulement que la 
fonction P(x, 7") < 1 uniformément en x pour de petites mes 7”. 

On dit qu'un ensemble J'EB suit un état x, si P(u,xs, 1) = 1 
pour tous les # = 1,2,... De la condition (D) il s'ensuit que si un ensemble 
l'suit un état x,, alors (1°) > €. Si un ensemble J'suit chacun des états qui 
le composent, on dit qu'il est invariant. Un ensemble invariant l'est dit 
minimal s'il ne contient aucun sous-ensemble invariant À tel que g{:1) < 
< g{(l"). Tout ensemble qui suit un état contient un ensemble invariant 
minimal. Deux ensembles invariants minimaux sont soit disjoints soit 
confondus à un ensemble ç-négligeable près. 

Soient K!, K?, ..., K* des ensembles invariants minimaux tels que 
K'NXI = G pour i # j, g(K?) = € et un ensemble invariant confondu 
avec X7 à un ensemble œ-négligeable près. De toute évidence, 1 < N = 


X ; 
= rx) . On remarquera que si le système entre dans l’ensemble X) à un 


instant quelconque il y restera pour toujours. Bien plus, on a le 
Méorème 1. Si /a condition (D) est remplie, il existe des constantes C et 
0,C = 0,0 < p < |, telles que 


ÿ 
1-P{n X U «) 2: Cp", n=1,2,...,x€X. 
J-1 


De ce théorème et du théorème de Borel-Cantelli il s'ensuit que quel 
que soit son état initial le système entre presque sûrement dans l’un des 
ensembles X? au bout d'un nombre fini de pas. Désignons par F/(x) la 
probabilité que le système entre jamais dans l'ensemble X7 à partir de l'état 
N: 


FX) = PU {£, € K)). 
n--l 


Comme le système reste pour toujours dans l'état X? s’il y entre, on a 
FX) = Jim P(u,x, KI). 


An — © 


Si x € K!, alors F{(x) = 1. De plus, pour tous les x € X 
Y 
Y FX) = 1. 
j=1 


1K0 


= Par ailleurs, de l'ensemble 7 on peut éliminer un de ses sous-ensembles 
K' y-négligeable (éventuellement vide) tel que P(x, À) = 0 pour tous les 
x € K\RKI, lim P(u, x, Ki) = O uniformément en x, l'ensemble X’\Æ' pou- 
vant être partitionné en d, (1 =: d, < ) parties disjointes K4, à = 0, 1,2, ..., 
d,—1 telles que P(x, K}) = | pour xEK}_,i=1,2,..., d,(par K} on 
comprend K$). On admettra que À’ a déjà été éliminé de X?, de sorte 


d,-1 
que Ü K!= K). Les ensembles K/, j = 1,2,...,N sont appelés classes 
1-0 


crgodiques, les ensembles Kh i= 0,1, ..., d;j—1 sous-classes cycliques 
de la classe A7. Si le systèmeentre dans la classe X7 à un instant quelconque, 
alors à tous les instants ultérieurs il parcourra cycliquement les sous-classes 
de cette classe pour d, :- 1. La classe X7 est dite apérivdique pour d, = 1. 
Appelons un ensemble [ES ensemble d'états non essentiels si 
lim P(u, x, 1") = 0 pour tous les x € #. 
NN —0 Co 
Donc, l'ensemble # des états d’une chaine de Markov vérifiant la 
condition (D) peut être divisé en un certain nombre de classes crgodiques 


Ki, j = 1, 2, ..., N,et en un ensemble d'états non essenticls X\(J Æ. 
J=1 


Ceci étant, toute classe ergodique peut être partagée en un certain nombre 
de sous-classes cycliques. 


Posons 
Flu = P, (Ù (84, €) 
ni 


pourxEX,j=1,2,...,N,i=0,1,...,d,-1. Si 5, € K; pour un n, 
CN J 
alors &,4, € K) pour tous les & == #. D'où 
FX) = lim P(ud,, x, Ki). 

De toutc évidence F/(x) = 1 pour x € Xf. De plus, pour x € X 

d) {1 

ÿ FAQ) = FAN. 

1-0 

Formulons maintenant le théorème fondamental du comportement des 
probabilités P(n, x, 1") pour n + co. 

Théorème 2. Supposons réalisée la condition (D). Il existe alors un 
système de mesures probabilistes 74, j = 1,2, ...,N,i= 0,1, ...,d-1, 
définies sur D, telles que pour tous les xE X, I'C K9 (bien entendu 
le) L 

dy-1 


lim P(ad,+m, x, l') = Y F9 14,,(1"). 
s=0 


N-> © 
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De plus, x{(Kf) = 1 et af(l') > 0 pour q{N Ki) > 0. La tendance vers 
Ja limite est uniforme par rapport à x et T°. 

En particulier, si x € K/, alors lim P(ud,+m, x, 1°) = 72/1") pour 
r = i+m (mod d)). (A noter que P(nd,+m, x, T') = P(nd,+m, x, l'O KI) 
pour x € K/etr = i+m (mod d,)). 

Ce théorème entraîne la convergence des moyennes au sens de Cesaro. 
Plus exactement, on a uniformément en x € Xct l'E B 


lim — rÈ PE, x, T°) = > FH{x) a), 


où 
I dj-1 
al) = -- > a), l'eS, 
d, {= 


de sorte que x! est une mesure probabiliste sur la tribu 8 et de plus z/(K1) = 1 
etz40) > 0,sig(T'NK9 > 0. Posons 


° ] = F ‘ L 
pl) = lim 2 P(&, x, 1°). (2.4) 


Pour chaque x € *, la fonction y, est mesure probabiliste sur #, puisque 
W 
FIG) æ 0 ct Ÿ F/(x) = 1. Si x € A, alors y, est confonduc avec la mesurc 


j-1 
r12. Si l'est ensemble d'états non essentiels, alors y1,(71") = 0. 

Théorème 3. Si /a condition (D) est remplie, alors pour tout x € X, la 
mesure jt, est stationnaire (cf. L 8.2.5). Réciproquement, toute loi stationnaire 


peut être mise sous la forme ÿ 0,77, où 0, sont non négatifs et leur somme 
j-1 
égale à 1. 

Corollaires. 1) Pour que la limite dans (2.4) ne dépende pas de x, il 
faut et il suffit qu'il cxiste une seule classe ergodique. 2) Pour que la limite 
de P(n, x, L°) pour nr —+ co existe, il faut et il suffit qu’aucunc classe ergodique 
ne contienne de sous-classes cycliques, c'est-à-dire d, = 1 pour tous les j. 

Supposons maintenant qu'est donnée sur X une fonction 1{x) réelle N- 
mesurable. Le théorème suivant est l'équivalent de la loi des grands nombres 
pour la suite {e{£,), n = 0,1,2,...). 

Théorème 4. Sÿ /a condition (D) est réalisée et 1x), X € X, est telle que 


[leG)1a (dy) <os,  j=1,2,...,N, 
Ki 


alors pour toute re probabiliste y sur 8 il existe P,,-presque sûrement 
la limite lim > v(Ë,) qui est égale à Î (y) z/(dy) pour E(w) € K1, 


mn —+ 
x) 
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où P,(-) = (] P,G-)z(dx). En particulier, s'il n'existe qu'une seule classe 
x 
ergodique, c'est-à-dire si N = 1, alors 


P, 1 lim ÿ (és) = ( u(») | = 


nu —+ oo nl ks0O 
x 


où x est l'unique loi stationnaire. (4 noter que (| v(y) (dy) = E,v(é,), où 
x 
E.(:) est l'espérance mathématique par rapport à la mesure Pa) ; 


Le théorème suivant décrit les fluctuations de la quantité - ÿ v(£,) 
k=0 


autour de la valeur limite. 

Théorème 5. Supposons que pour une chaîne de Markov donnée est 
réalisée la condition (D) et qu'il n'existe qu'une seule classe ergodique qui 
est apériodique. Désignons par x l'unique loi stationnaire de la chaîne. Soit 
donnée une fonction vx), x € X, réelle B-mesurable, telle que pour un 


0 — 0 
f Le) 19 (dx) < co. 
x 


existe alors la limite 


_lim E, (7 x (u(£:) — En) 1 = 0, 


et sie? 2 0, alors pour toute loi initiale pt 
a 
| _# 
lim P,4--— (és) — E,u(é,)) < ah = — - e ?d 
nm —+ 00 A+ V/ni£ ), ‘ | V'2n ] ' 


uniformément ena € R'. 


8.3. Chaînes de Markov à ensemble discret d'états 


8.3.1. Matrices des probabilités de passage. Considérons des chaînes de 
Markov homogènes (£,, P,) à valeurs dans un espace des phases (X, 8), 
X étant supposé dénombrable ou fini, $ la tribu des parties de X. De telles 
chaines sont définies par les ne de passage en un pas dans des 
ensembles à un point : P(x, y) = P,{é, = y}, x, »E X, car P(x, T) = 
= P{£, € 7} = L P(x, ») pour tout Z'C X. Les nombres P(x, y), 


x, EX ent Gé matrice P, éventuellement infinie, dans la vx-ième 
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ligne de laquelle sont situées les probabilités de passage en un pas de 
l'état x à tous les états » possibles et dans la y-ième colonne, les probabilités 
de passage en un pas de tous les états x possibles à l’état y. Les éléments 
de la matrice P sont non négatifs et la somme de chaque ligne est égale à 1. 
De telles matrices sont dites stochastiques. Toute matrice stochastique 
définit une chaîne de Markov homogène unique à l'équivalence près pour 
laquelle les probabilités de passage en un pas sont confondues avec les 
éléments de cette matrice. 

Les probabilités de passage en 1 pas P(n, x, v) forment aussi une matrice 
stochastique qui est égale à la puissance n-ième de la matrice P ainsi qu'il 
résulte de l'équation de Chapman-Kolmogorov 


P(u, x, y) — D P(Xx, 21) PC 22)... PO 1) 
Epoclnn € 
où x,}E X,nu = 2, 3,.... Pour x = 0 on conviendra naturellement que 


P(0, x, y) = 1 pour x = y et P(0, x, ») = 0 pour x # y, de sorte que les 
probabilités de passage en zéro pas forment une matrice unité /. 
Si X est fini, on a pour les probabilités de passage en # pas la formule 


suivante 
er CSS | .n ‘ 
PQ, x,y)= Ÿ _—— : ii je | , (3.1) 
kr (on 1)! dÂTs ya(Z) 2-2 


où n=0,1,2,...,x,»€ X, 2, 2, ..., 4, sont les racines de l'équation 
det (27—P) = O0, m1, m2, ..., m, leurs multiplicités respectives, Af,,(2) 
cofacteur de l'élément situé à l'intersection de la }-ième ligne et de la x-ième 
colonne de la matrice À/—P,w,(2) = (2—2,) "* det(21-P). 


8.3.2. Classification des états. Un état y € X est accessible à partir d’un 
état x € X'si P(u, x, y) = 0 pour un certain # = 0, 1, 2, ... . Si y est acces- 
Sible à partir de x et x accessible de y, on dit que x et y sont des états 
communicants. Ainsi, on a introduit dans l'ensemble X une «relation » 
symétrique, réflexive et transitive. Donc, l’ensemble X peut être décomposé 
en classes disjointes d'états communicants, entre eux. Deux états de classes 
différentes ne communiquent pas entre eux, cependant on peut passer des 
états d'une classe à ceux d'une autre. En d’autres termes, le système peut 
passer avec une probabilité positive d’un état à un état quelconque de la 
même classe. De plus, le système peut quitter une classe mais sans possibilité 
de retour. 

Une chaîne de Markov (£,, P,) est irréductible si tout couple d'états 
X, EX cest un couple d'états communicants. Autrement dit, tous les 
états d'une chaine irréductible constituent une classe d'états communicants. 

Un état x est essentiel si tout état accessible à partir de x communique 
avec x. Le cas échéant il est non essentiel. Pour tout état non essentiel x il 
existe au moins un état y accessible à partir de x, mais x est inaccessible à 
partir de y. 
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On s'assure sans peine que d’un état essentiel on ne peut accéder qu'à 
des états essentiels. 11 s'ensuit que chaque classe d'états communicants est 
composée ou bien d'états essentiels ou bien d'états non essentiels. 

L'ensemble des classes d'états communicants en lesquels se décompose 
l'espace de tous les états possibles d'une chaine donnée peut être muni d'un 
ordre partiel à l'aide de la relation suivante. On dit qu'une classe X3 suit 
une classe X, si pour un x € Y, au moins il existe y € X4 tel que y soit 
accessible à partir de x. (Il s'ensuit entre autres que tout état y € #3 est 
accessible à partir d'un état x € #, quelconque si seulement X3 suit X,). 
Cette relation est réflexive, transitive, mais pas symétrique, c'est donc une 
relation d'ordre partiel sur l'ensemble des classes. Il est évident que seules 
les classes d'états essentiels (si elles existent) ne sont suivies par aucune autre 
classe. Si le nombre de classes d'états communicants est fini, il existe néces- 
sairement au moins une classe d'états essentiels. Dans le cas général il 
peut n’exister aucune classe d'états essentiels. 

Si l'état initial d’une chaîne se trouve dans une classe d'états essentiels, 
le système ne quittera jamais cette classe. Donc, si toutes les classes sont 
constituées d'états essentiels, la chaine se décompose pratiquement en 
plusieurs chaines correspondant à chacune de ces classes. 


8.3.3. Périodicité. Soit d(x), x E X, le p.g.d.c. des nombres n tels que 
P(u, x, x) > 0. Si P(n, x, x) = 0 pour tous les # = 1, 2, ..., on conviendra 
que d(x) = . On démontre que d(x) est constant dans chaque classe d'états 
communicants. La valeur commune d = d(x) pour les x d'une classe 
donnée s'appelle période de cette classe. Une classe est apériodique si d = 1, 
périodique, si d > 1. Par suite, une chaine irréductible sera périodique ou 
apériodique selon que sa période est plus grande ou plus petite que un. 

Le théorème suivant décrit le mouvement d'un système dans une classe 
périodique d'états communicants. 

Théorème 1. Chaque classe K d'états conmmunicants de période d(d < ©) 
peut être partitionnée en d sous-ensembles Ki, K,, ..., Ki_, deux à deux 
disjoints tels qu'en un pas le système ne puisse passer de K,, i = 0, |, ... 
...,d—2, qu'en les états de l'ensemble K,.,, et de K,_,1 qu'en les états de 
l'ensemble K,. Si, de plus, xEK,YEK,, il existe n, = mx, y) tel que 
pour tous les n = n, l'on ait 

P(nd+r-—i, x, y) > 0. 


En particulier, P(nd, x, x) > 0 pour tous les n > n5 = noÂx, X). 

Les ensembles K,, i = 0, 1, 2, ..., d—1 s'appellent sous-classes de la 
classe périodique d'états communicants. 

Exemple. Soit X# un réseau entier sur la droite et supposons que le 
système ne peut aller en un pas d'un état x € # que dans l'état x + 1 avec la 
probabilité p ou dans l'état x — 1 avec la probabilité g, p+q = 1, p, q = 0. 
Une telle chaîne est irréductible, périodique, de période 2. Les sous-classes 
K, et K, sont respectivement les ensembles des nombres pairs et impairs. 


8.3.4. Récurrence. Soit r, le premier temps d'accès d'un état y € X après 
l'instant O, c'est-à-dire rt, = inf{n: n = 1,2, ...,$, = y} et, de plus, si 
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&, # }' pour tous les x — 1,2, ..., alors on conviendra que r, = 4 «>. 
Posons f(0, x, y) = Oct fn, x, y») = PAT, = un n=1,2,...,x\,YEX. 
Appclons 


FD = À JO x,» = Pr, < co}. 


F(x, ») est la probabilité que le système passe jamais à l'état y à partir de 
x ; pour x = y F(x, x) est la probabilité que le système, ayant quitté l'état 
x, y revienne jamais. 
Un état x est récurrent si F(x, x) = Let non récurrent si F'(x, x) < 1. 
Les probabilités de passage et les probabilités de premier accès sont 
liées par la relation 


PQ, x, ») = S SUR, x, y) P(n—k, y, y), n— 1,2, ... 
&-0 
x,» EX. 
En posant 


P ax, JV) = » 2rP (n, À, »), FC, D) = > f (u, X, ») 
»n - n -0 


pour À € [0, 1] on déduit de la formule précédente : 


I 
1— Fix, x)° 


Ces formules entraînent le 
Théorème 2. Un état x est récurrent si et seulement si 


Pa(x, x) = Pix, ») = BUx, ) Pa), x # y. 


GX, x) = À PGI, x) = es, 
CE 


non récurrent si 


G(\, x) — > Pin, x, x) = en. 
s-:0 


Dans le cas non récurrent 

l 
1—F(x, x)° 

On peut démontrer par ailleurs que les états communicants sont simul- 
tanément récurrents ou non récurrents, de sorte que la récurrence est une 
propriété caractéristique des classes d'états communicants. 


Le théorème suivant nous donne un critère de récurrence d’une chaine 
de Markov irréductible en termes de fonctions excessives. 


G(X, x) = 
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Théorème 3. Une condition nécessaire et suffisante pour qu'une chaîne 
de Markov irréductible soit récurrente est que toute fonction excessive soit 
constante. 

De façon plus exacte, si une chaîne est récurrente et irréductible, 
l'unique fonction excessive (à un facteur non négatif constant près) est la 
fonction identiquement égale à l'unité. Cela signifie que le système d’inéqua- 


tions 
>= ÿ P(,»)70), x EX, 


CAR 


ne possède pas de solutions non négatives, différentes des solutions de la 
forme g(x) = const. 

Inversement, si une chaine (pas forcément irréductible) possède au 
moins un état non récurrent, il existe toujours unc fonction excessive non 
constante, par exemple 


(») 1, Si Y=Xo; 
[4 —_ 
Fe FG,,Xo) Si YA Xo 


où v, est un état non récurrent fixe. 


8.3.5. Propriétés des états récurrents. Désignons par gx, y), x, EX, 
la probabilité qu'un système ayant quitté l'état x accède une infinité de fois 
à l'état y. En se servant de la propriété de Markov forte de la chaîne, on peut 
montrer que g{x, y) = F(x, p), si seulement l'état y est récurrent. En parti- 
culier, q{y, >) = 1 pour tout état récurrent y. En d'autres termes, la proba- 
bilité que le système passe une infinité de fois par l'état récurrent y, en 
quittant x, cst égale à la probabilité que }' soit jamais accessible à partir 
de x. 

Bien plus, si un état x est récurrent et F(x, y) = 0, alors q{x, y) = 1, 
c'est-à-dire en quittant l'état récurrent x le système est forcé de passer une 
infinité de fois par l'état y accessible à partir de x. Ccci étant, F(), x) = 0. 
En particulier, si x est récurrent et y accessible à partir de x, alors y cst 
presque sûrement accessible à partir de x (F(x, y) = 1). 

Par ailleurs, si y n'est pas récurrent, alors q{x, y) = 0 pour tous les 
xE X, et en particulier g{y, y) = 0. Cela signifie que le système ne passe 
qu'un nombre fini de fois par les états non récurrents (ceci découle visible- 
ment aussi du théorème 2). 

Donc, d’un état récurrent on ne peut passer qu'à un état récurrent. 
Les états récurrents sont essentiels. 


8.3.6. Comportement des probabilités de passage à la limite. 
Théorème 4. Pour x, y € Xona 


# 
S P(n,x,y) 
FA," = lim 


Fe À p(n,y,}) 


n=0 
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De cette formule il résulte que G(x, y) = ÿ P{u, x, y) = + pour tous 
n=0 


les x, y d’une même classe récurrente. Si y n’est pas récurrent, alors 
G{x, y) <= « pour tous les x € X. 

On obtiendrait des résultats plus précis en appliquant le théorème de 
renouvellement. Désignons par +} le premier instant accès de l'état y après 0 
(cf. n° 8.3.4). Posons 


Titi inf{n: nr E, = y} 2: 


On admet que 7ht! - 4 si ë, # y pour tous les n > 7}. La propriété de 
Markov forte de la chaîne entraîne que les quantités TT = Th TT. 5e 
sont indépendantes et P,-identiquement réparties si seulement y est un état 
récurrent. Si l'état initial est x, F(x, ») = 1 et } récurrent, alors toutes ces 
quantités sont P.-indépendantes entre elles et, à l'exception de la première, 
sont P,-identiquement réparties. Cette circonstance permet d'appliquer 
le théorème de renouvellement à l'étude du comportement des probabilités 
de passage P(n, x, y) pour n > co. 

Désignons par »1, le nombre moyen de pas jusqu'au premier retour 
à l'état y : 


œ 


m, = À nfG,y,3) — Et = te 


Théorème 5. a) Si y est un état non récurrent, alors pour tous les x € X 
lim P(u,x,y) = 0; 


HN — ww 


b) si x et y appartiennent à différentes classes d'états essentiels, alors 
pour tous les n on a P{(n, x, y) = 0 ; 

C) six et y appartiennent à la même classe d'états essentiels de période d, 
et de plus XCK, vCK, où K, sont les sous-classes du théorème 1, alors 


lim P(nd+1,x, y) = 


mn — où Mr 


sous réserve que l=r—i(mod d) et P(ud+1,x, y) = 0 pourvu que 
lA#r-i(mod d): en particulier, si d = 1, c'est-à-dire si la classe est 
apériodique, alors 
1 
lim P(u,x, y) = —- ; 


n —> m, 


d) si un état X n'est pas essentiel et y appartient à la classe des états 
essentiels de période d, alors pour tous les r = 0, 1,2, ..., d—1, on a 


lin PGad+r, x, y) = EUX, De 


n + nm, 


[SK 


où 


F,(x, y») = > JU, x, y). 


n=r"(mod d) 
d-1 
(on remarquera que F,{x, y) = 0 et > Ex, ») = FX, ») = 1. De plus, 


il est clair que F,(x, y) = P, {Ë, = y pour un n = r (mod d), n — o}) 


Ce théorème entraine un résultat un peu plus grossier sur la conver- 
gence des moyennes de Cesaro. 

Corollaire. Si l'on admet que #1, = pour les états non récurrents 
y, alors pour tous les x, }' € X'existe la limite 


lim UN D P(n, x, y) = x, y), 
et de plus 
FO) 


ax, y) = 
(x, 3 m, 


8.3.7. Classes positives et nulles. On dit qu'un état récurrent y est nul si 

lim P(rd(y), y, y) = 0 et positif si lim P(rd(r), », ») — 0. Onétablit 
immédiatement que dans une classe récurrente tous les états sont simulta- 
nément positifs ou nuls. Si y est un état positif, alors a < © €t 7(}) — 


= (y, y) = _ . Si }' est un état nul, alors 2()) — 


Il saute ve la propriété d’une classe d'être . ou nulle cest 
étroitement liée à l'existence des mesures invariantes. 

Pour les chaines de Markov à nombre dénombrable ou fini d'états, il 
est naturel de considérer les mesures (les charges) uniquement sur des 
ensembles à un point : 4) = /{({y}), car pour °C X'ona 


TOUT 
rer 


Une mesure «(y) définie pour y € À © X est invariante sur un ensemble 
K si guy) = Ÿ (x) P(x, y) pour tous les }'€ K. 
xCÆ 
Théorème 6. Si K'est une classe d'états essentiels, toute mesure y inva- 

riante sur K et telle que 
D lu(v)l < co, (3.2) 
vEK 

est de la forme (y) = cx(y), où » € K et © est une constante arbitraire. 


1K9 


| Corollaires, a) Si X est une classe récurrente positive, l'unique mesure 
invariante sur K à vérifier la condition (3.2) et la condition 


D uO)) = 1, (3.3) 


CA 
est la mesure 


: I A : 
a(v) = lim + D P(n, v, »), vEK. 


nn -> ©œ 


Si, en outre, 4 est la période de la classe K, alors pour toute sous-classe 
K,j=0,1,2,...,d-1,ona 


ÿ a(y) = ! : 


ve, 


b) Si K'est une classe récurrente nulle, la seule mesure invariante sur K 
à vérifier la condition (3.2) est la mesure triviale (407) = 0,»yEK). 

c) Si la chaine de Markov est arbitraire et 4(y), y € X, est une solution 
absolument sommable du système d'équations 


no) = À HMP(X,»), »EX, (3.4) 


2EX 


alors /(y,) = 0 pour tout état non récurrent y4. 

d) Pour qu'une chaîne de Markov irréductible soit récurrente positive, 
il faut ct il suffit que le système d'équations (3.4) admette une solution non 
triviale absolument sommable. 

c) Une condition nécessaire et suffisante pour qu'une chaîne de Markov 
irréductible admette une loi stationnaire est qu'elle soit récurrente positive. 

f) Si une chaine est irréductible, récurrente positive et apériodique, 
l'unique solution du système (3.4) à vérifier les conditions (3.2) et (3.3) 


est la mesure 
nO) = lim P(u, x, p). 


Le théorème suivant décrit toutes les lois stationnaires possibles d’une 
chaine donnée (sous réserve qu'elles existent). 

Théorème 7. Soit (Ë,, P,) une chaîne de Markov homogène d'ensemble 
d'états discret. Désignons par D, les classes récurrentes positives, & € À, 
A étant en général une collection dénombrable d'indices, D, # Dg pour 
a # fi. Posons D = UV. D... Pour qu'une mesure (x), x € À, soit station- 


at4 
naire, il est nécessaire et suffisant qu'existe une suite {1,,« € A}, À, = 0 et 
S À, = 1, telle que 


ac a 


si xéD;: 
mx) = | + 
A,n(x) si xED,, «@€A. 
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8.3.8. Probabilités avec interdiction. Soit /’ un ensemble d'états, /' € X. 
Posons 


rP(n, XL y) + D du Z:) PC: Z2) …. P(z,-1 y), 


Spe CPE .. £a -1 


X,pE X,n=1,2,.... Cette quantité définit la probabilité que le système se 
rende en nr pas de l'état x à l'état y sans passer à aucuninstant 1,2,...,n—1 
par les états de l'ensemble 7° Ces probabilités sont appelées probabilités 
avec interdiction ou tabou-probabilités. Si 1'— {z}, on écrira ,P(n, x, y) 
au lieu de &}P0 x, }). De toute évidence, f'(n, x, y) == PU X, }). 

Pour tous les n = 1,2,...,x,r,ZE X,1'c X,z6 ll ona 


a 
rPU,X, 3) = ,rPOX M4 D rPU,X, 2) PR, 2, y); 
1 


k= 
n—1 

rPG,Xx,») = PQ, x, y)+ D PU, N, 2), rP(n-—k, 2, y), 
15 


où 
s, rlve, AY y) Te ur PO : * y). 


Posons 
7 | X(5)CX) pour «vél'; 
X,)) = 

re d 0 pour vel 
où Y,(x) est l'indicateur de l'ensemble B © X. Si par ailleurs Z' = {y z}, 
on conçoit qu'il faille désigner ,/(n, x, y) — (e, PC N,}) pour n = 
= 1,2,...,x,3,z€ X. Ceci est la probabilité que le système ayant quitté 
l'état x se trouve pour la première fois dans l'état y sans passer aux 
instants 1,2,...,n1—1 par l'état z. Posons encore / (0, x, y) = 0. Compte 
tenu de ces notations et conventions, on déduit immédiatement des éga- 
lités précédentes les relations suivantes 


PQ, x, y) = » JU Xx,») PR, y, P) + 8,04 (5) 22 y: 


Sn, x, y) = ÿ PU,XX) SR, XY) OX A7, 
40 


qui sont valables pour n = 0, 1,2, ..., où y,(x) est l'indicateur de l’en- 
semble 7°, à, = 1 pour # = 0 et à,, — 0 pour # # 0. D'où, si l’on admet 
que 


«GX, ») = > PC, x, »), (x, ») = > Ju, X, y), 
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on déduit 
CC, y) = AP) + FC, y) RAC y), ZFY, 
FR, ») = ,G(x, x) ,F(X, y), X # y. 


Si x et y sont des états communicants, il est évident que ,F(x, ») = 0. 
Il résulte donc de la deuxième relation 


FI) LR 
2FQ, } FG,») | 


pourvu que «x et y soient communicants. De la première relation on obtient 
pour les états communicants y et z 


0 = ,G{(z, y) = Fr, 2)° 


O0 < ,G(x, x) = X#}, 


FC y) _ 
FO, 2) : 


On peut montrer par ailleurs que si x et » appartiennent à une même 
classe récurrente, alors 


VA. 


ÿ P(u, x, ») 
GG,» = lim =, 


ni pi P{u, X, X) 


Il s'ensuit que ,G(x, x) = 1! pour les états récurrents. Si, de plus, x et r» 
7) 
(x) 


Posons m,, = E,r! = v nf(n,x, y). La quantité m,, est le temps 


sont des états d’une même classe positive, alors ,G{x, }') = 


moyen écoulé avant le Didier accès à l'état y, si l'état initial est x. Si 
x = p, le temps moyen m,, est confondu avec la quantité m1, introduite 
au n° 8.3.6. 


Théorème 8. Si F(x, y) = 1, alors 
D ,G(x, 7) = ms. 
sEX 
Il résulte de ce théorème que la séric D :C(X, >) converge pour une 


La 
classe récurrente positive et diverge pour une classe nulle. 

Du théorème 6 il s'ensuit que si K est une classe récurrente nulle, il 
n'existe pas de mesure invariante sur K, à variation bornée et différente de la 
mesure triviale. Le théorème suivant montre que dans ce cas il existe une 
mesure invariante sur Æ de masse totale infinie. 

Théorème 9. Soit K une classe récurrente. L'unique solution non négative 
du système d'équations 


HO) = À AG) PQ»), OK 
2€K 
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à satisfuire la condition p(z,) = À pour un Z$ UK est la mesure , G(z,, >), 
JE K. 


8.3.9. Thévrème ergodique. Soit (£,, P,) une chaine de Markov homogène 
dont les états forment une classe récurrente À. Supposons que sur À est 
détinie une fonction réelle (x) et considérons la fonctionnelle 


ML) = > UE), n=0; 1:2:..; 


Aa -U 


Pour y € X posons r!= inf{n:n=1,2,...,$%, = y}, T'!=inf{n:n> 
> és =Jh k = 1,2,... (cf. n° 8.3.6). Vu que les états de la chaine 
forment une seule classe récurrente, on a P,{Ti < } = 1 pour tous les 
x,yEX et k = 1,2,.... La quantité 7,(v) peut être mise sous la forme 

ti 


1a{v) _ À vs) + À 


1 n 
Ga, v) + > v(ê2), 


= sont") 


til 


GO, v) D u(é,), k = 1, 2, .. 


L , . 5 
et », = v,(u)est une variable aléatoire pour laquelle °° < 1, TP > à 


(autrement : »,(n) = max{k:7t$ «n) = min{k:r'!>n}), On remar- 
quera qu'en vertu de la propriété forte de Markov les variables &,(y, v), 
k = 1,2,... sont indépendantes et identiquement réparties, de plus la 
P,-loi de la variable 4,0, v) ne dépend pas de x. En effet, pour les « réels 
on à 


PAG v) = a} + EP{ULEU 0) < a/3,} = 
h EP 10, v) = a} = P,(610, v) =< æ}. 
‘y 


On peut montrer par ailleurs que si le moment d'ordre p de la variable 
GC, v) existe pour un J'€ Y, il existera pour tout y € X. En particulier, 
pour p = 1 et sous réserve que 


ÿ CO, 2) | t{z)| = ©, 


EX 


on a 


E {0 v)} Fa D GO, z) (2). 


Ex 
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Posons 


So) = }, :G0Xx, ») to). 


EX 


Il apparaît que si S,(v) est finie (on entend par là D sCUX, ») lu) | = 
ex 


= S (| v|) < æ) pour un x € Ÿ, elle le sera pour tous les x. De façon 


analogue, si S (v) = 0 pour un x, elle le sera pour tous les x. Si en outre 
S (u) et S,(v) sont finies, le rapport S,(u)/S, el ne dépend pas. de x. Si la 


chaîne cst récurrente positive, on a ,G{(x, y) = … 1@ de sorte que 


ax) S,(v) = À 20) vO), 


Ex 


où (y) est la loi stationnaire de la chaîne. 

Le théorème suivant s'appelle théorème ergodique. Le point fort de sa 
démonstration est la représentation de la variable 7,(v) par une somme de 
variables aléatoires indépendantes identiquement réparties et de certaines 
contributions (cf. plus haut). 

Théorème 10. Si une chaîne (E,, P,)est irréductible et récurrente, et les 
fonctions u et v définies sur l'espace des états telles que S (u) et S,(v) soient 
finies et non nulles, on a alors 


W 
im 2 540 
No È S,(v) 
pa u(£,) 


P,-presque sûrement pour tout x € X (on a indiqué précédemment que le 
second membre de cette égalité ne dépendait pas de y). 
Corollaires. 1) Si une chaine irréductible est récurrente positive et la 
fonction (x), x € X, telle que ÿ° x(y) |u(y)l < , alors 
sex 


lim = ÿ u(é,) = ÿ, 10) 10) 


HF À Ex 


P,-presque sûrement (pour tous les x € #). 

Ceci traduit le fait que la moyenne temporelle pour la suite {u(ê,), 
n = 0,1,2,...} converge vers la moyenne de la fonction (x) par rapport 
à la loi stationnaire. 


194 


2) Si Y xG)luy)l << pour une chaine irréductible récurrente 


vEex 
positive, alors pour tous les x € Y 
un LE N. ÿ ué)— ÿ 0)10)||- 


vez 
3) Pour toute chaîne irréductible récurrente positive on a P,-presque 
sûrement (pour tous les x € X) 
v An) 
im #O 2 2ç) lim ME 2 1, 


n —+> © —+ œ 


où v,(n) et r$ ont été définies plus haut. 


8.3.10. Théorème limite central pour chaînes de Markov. Soient (£,, P,) une 
chaine de Markov irréductible et récurrente positive, u(x) une fonction 
réelle définie sur les états de cette chaine. On a vu plus haut qu'une condi- 
tion suffisante d'existence de la moyenne E,é, (y, v) est 


S Iwy)lzOp) < oo, 


rex 


où (y) est la loi stationnaire. Ceci étant, 
tir 
El, lvl) = E, L, Lu(é,)I. 


Supposons maintenant que la fonction vw satisfait une condition un 
peu moins stricte, savoir 


E, 140, v)| = 


|" 


E (£,)| < (3.5) 


Posons 
rti_i 


HAL) = E; E u(é,), 


a né eo ce 2x 


Théorème 11. Si une chaîne de Markov irréductible, récurrente positive 
et une fonction v sont telles que y1,(v) existe (c'est-à-dire est réalisée la con- 
dition (3.5)), alors la P,-limite, x - X, de la quantité 


_ à u(é,) 


existe et est égale à x(y) pv), y € X. 
Il s'ensuit en particulier que la quantité x(y) ,(v) ne dépend pas de y. 
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Posons maintenant 
à, v) = 0, v)—70) uv) (GrÉ*! — 7) 


YEX,k=1,2,.... Les quantités 0,(y, v), & = 1,2,..., sont indépen- 
dantes, identiquement réparties par rapport à la mesure P,, x € X, et, de 
plus, leur loi P,{à,(y, v) < «} ne dépend pas de x. De toute évidence 


E, 6,0, v) = 0. Posons 
of) = EJôA(, v)}°. 


On peut montrer que si o(v) < pour un }'€ #, alors av) « pour 


tous les y € X#. 
Théorème 12. Si O -: où < pour une chaîne de Markov irréductible, 


récurrente positive et pour une fonction v, alors 


ii pm. Le 2. [5 
ss. | v/Mn V2 


où x € NX, « un réel arbitraire, a = x(y) yo), b = x(y)o{(v). Les quantités 
a et b ne dépendent pas du choix de y € X. 


Du théorème 11 il s'ensuit que _ 7,(v) — a par rapport à la probabilité 


P.. Le théorème 12 montre ainsi que les fluctuations de la quantité - À C0) 


autour de la valeur moyenne a suivent la loi normale asymptotique, si 
seulement existe et est différent de zéro le moment d'ordre deux de la 
variable à,(, v). 
Remarque, La quantité 7,(v) peut étre mise sous la forme 
rytn)— 1 


m0) = rip -ti)+ À àC,v)+P,+h, 


E=l 


où let J,”’ sont confondus respectivement avec le premier et le troisième 
termes de la représentation de la quantité #,.(v) citée au n° 8.3.9. Pour 
démontrer les théorèmes limites pour 7,(v), on démontre en général que 
les quantités F* et F” (prises avec un facteur normant) sont asymptotique- 
ment petites puis on applique les théorèmes limites classiques pour les 
sommes de variables aléatoires indépendantes à la somme 


AC) 1 


» àO, v). 
E=l 


L'hypothèse du théorème 12 signifie que la loi de la variable ô,(;,, v) tend 
vers une loi normale, donc à la limite on obtient une loi normale. Si l’on 
admet que la loi de à,(y, v) tend vers d’autres lois stables, on peut déduire 
d'autres théorèmes limites pour 7, (v). 


DEUXIÈME PARTIE 


Théorie des processus aléatoires 


Chapitre 9 


NOTIONS FONDAMENTALES DE THÉORIE 
DES PROCESSUS ALÉATOIRES 


9.1. Définition d'un processus aléatoire 


0.1.1. Lois finidimensionnelles, On appelle processus aléatoire sur un 
espace probabilisé (9, G, P) une famille de variables aléatoires &(s, «) 
dépendant d'un paramètre réel # appartenant à un ensemble T. Cet ensemble 
est dit ensemble de définition du processus. Les variables aléatoires &(/, w) 
peuvent être réelles, complexes ou vectorielles. L'espace X dans lequel 
Et, w) prend ses valeurs s'appelle espace des phases du processus. Pour les 
processus aléatoires, comme pour les variables, on omettra souvent l'argu- 
ment w et l'on écrira £(#) pour &(s, w). Les lois finidimensionnelles (partielles) 
qui sont unc collection de fonctions définies pour chaque £ naturel par les 


relations : 
Fu, "(Ar Arr Pa) ein (Cr «w)C 4}} 


OÙ files ET, Au An ..., A4 SOnt les boréliens du domaine de 
valeurs du processus, comptent parmi les caractéristiques essentielles d’un 
processus aléatoire. 

Les lois finidimensionnelles satisfont les conditions évidentes suivan- 
tes : | 

[. La fonction F,,,...,,(4 -.., 4,) est loi conjointe de k variables 


aléatoires pour /,, fe, .…. De fixes ; 


DE En nn es À) © f, 1 (4, ..., 4,,) quelle que soit la 
D ÉRulation in es D de note n PR 
II. Si Xest le domaine de valeurs du processus, alors Fun n X 


X(4, CCE] SA; v À) = avr F nt (Av . e À, 1) 
Les lois finidimensionnelles 7... (4 »-.., 4,) peuvent être définies 
par les densités de probabilité finidimensionnelles, c'est-à-dire par des 
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fonctions /,,...,(% ---,x,) telles'que 
F,, AGIT HE À)) SE I] LE [PA RAA GITE ... X4) dx; …. dx, 
4x 


À; 


La question de savoir à quelles conditions il existe un processus aléa- 
toire admettant une collection donnée de fonctions F,,...,(4:, ..., 4,) 
pour loi finidimensionnelle est résolue par le théorème suivant. 

Théorème 1 (Kolmogorov). Soient F,,...,,(4:, ..., 4,) des fonctions 
définies pour t1,...,12€T, Au... A: € SX), tribu des boréliens d'un 
espace euclidien de dimension finie X. Pour qu'il existe un processus aléatoire 
admettant F,,...1(A1 --., 4,) pour lois finidimensionnelles, il est nécessaire 
et suffisant que soient réalisées les conditions 1 à III. Pour espace probabilisé 
on peut prendre l'espace (9, S, P) où {2 est l'ensemble de toutes les fonctions 
aXt) définies sur T à valeurs dans X ; ©, la plus petite tribu engendrée par 
es ensembles cylindriques, c'est-à-dire les ensembles de la forme 


{o : w(1,)€ 4,,...,œ(1,)€ 4,} = Can es An) 
P, une mesure définie par 
PC nCAu 22e À)) = Ends 22e À) 
Le processus aléatoire cherché sur cet espace probabilisé est défini par 
(4, ©) = w(r). 


Les fonctions E(t, w) à w fixes sont appelées fonctions échantillonées ou réali- 
sations du processus aléatoire. 

Le théorème de Kolmogorov propose une construction de processus 
aléatoire à lois finidimensionnelles données qui conduit à un vaste espace 
de réalisations. On a intérêt parfois à construire un processus dont les 
réalisations possèdent des propriétés de régularité (par exemple, sont 
mesurables, continues, dérivables, etc.). 

On dit que deux processus aléatoires sont stochastiquement équivalents 
au sens large si leurs lois finidimensionnelles sont confondues. 

Théorème 2. Pour qu'un processus donné admette un processus sto- 
chastiquement équivalent au sens large dont les réalisations appartiennent 
à un ensemble F € 9, il est nécessaire et suffisant que P(F)= 1, où P° 
est une mesure extérieure construite d'après la mesure P définie dans le 
théorème de Kolmogorov : 


P‘(G)= inf  ÿ P(C:), 
Uc:2 9 
où C, sont des ensembles cylindriques ; G un ensemble quelconque de 2. 
Si cette condition est réalisée, pour espace probabilisé du processus 


on peut prendre (F,G*,P*), où G* est la tribu des parties de {2 de la 
forme FNC, CEG, le processus étant lui-même défini par la relation 


E(t, ©) = ot). 
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Soit é(r, w), 1 € T, un processus aléatoire (réel, complexe, ou vectoriel) 
défini sur un espace probabilisé arbitraire (f2,&, P). Si F4 représente 
l'espace des fonctions ayant les mêmes valeurs que &(s, ) et ©, la plus 
petite tribu contenant tous les ensembles cylindriques de F,;, alors l’appli- 
cation 

o —+ ë(: , w) 


est une application mesurable de l'espace (92, S) dans (F,, ©.) c'est-à-dire 
pour tout 4€ G{w: Ë(-,w)E A}EG. Cette application associe à la 
mesure P une mesure 


HA) = P({w: E(,@)EA}) pour 4A4E€&:. 


La mesure uze(-) est dite mesure associée au processus aléatoire &(r, w). 
Elle est confondue avec la mesure construite avec les lois finidimensionnelles 
du théorème de Kolmogorov. 

Les lois finidimensionnelles du processus £(1, w) sont commodes à 
définir à l’aide de la fonctionnelle caractéristique du processus : 


4@) = E exp {i [ (EG, w), dg(r))}, 


définie pour toutes les fonctions en escalier g sur T à valeurs dans X ; 
(Ë, de) est le produit scalaire dans X ; l’intégrale de l'exposant est une 
intégrale de Sticiltjes. 


9.1.2. Moments. Soit &(s,«) un processus aléatoire numérique tel que 
E | (rt, &)]" = . Pour k -< m sont alors définies les fonctions 


Mans 1e) = Ei(r, ©)... Et, w). 


La fonction »,(r,, ..., !,) s'appelle moment d'ordre k du processus &(s, w). 
Si E |£(r, w)lF < ©, 1€ T pour tous les &, les moments de tout ordre du 
processus sont définis. 

Les moments les plus souvent utilisés sont d'ordre un ct deux : c'est-à- 
dire la valeur moyenne »",(#) du processus et »1,(#,, f2). Cependant, au lieu 
de mA(f1, 2) on considère généralement la fonction R(#,, #2) = m{1,, fe) — 
—m\(t,)(:) appelée fonction de corrélation. La valeur moyenne peut 
être une fonction quelconque définie sur T7. La fonction de corrélation 
R(r,, f2) cst définie positive : 


RG, tx > 0 
À (ls XIXe 


pour tous les /,,/2,...,1, de T et les réels x,,x2, ...,x,. Toute fonction 
R(#,, t2) définie positive est fonction de corrélation d’un processus. 

Soit &(r, w) un processus aléatoire à valeurs dans un espace euclidien # 
de dimension finie. On dit qu'une fonction &(s) définie sur T et à valeurs 
dans X est valeur moyenne du processus si pour tous les z € X 


E(E(e, co), 2) = (eût), 2). 
199 


On dit qu'une fonction Z(r, 5) définie pour #, 5 € Z'et dont les valeurs 
sont des opérateurs linéaires sur #, est une fonction de corrélation opéra- 
torielle d’un processus vectoriel si 


E(é(4, w), z) (EG, w), u) = (B(, s)z, u)+(a(r), z) (as), u) 


pour z,u € X. La fonction opératorielle B(r, s) est aussi définie positive : 
SÈ Zip. CA lie. 12 € T, alors 


> (CIUR UYIZR z) 57 (). 
9 


De plus, elle est symétrique au sens suivant 2 B(4, 5) =: H°(1, 3), où B° est 
l'opérateur adjoint de Z. 

Toute fonction de corrélation opératorielle peut être définie par sa 
matrice dans une certaine base. Cette matrice s'appelle matrice de corréla- 
tion du processus vectoriel. 

Soient &,(r) et &,(r) deux processus aléatoires sur un même espace 
probabilisé. La fonction 


bal, s) 7 Ef,(r) ë:(s) — E£,(1) Eÿ;(s) 


s'appelle fonction de corrélation mutuelle des processus &,(r) et &,(r). 
Si buts, s) (K == 1,2) est la fonction de corrélation du processus ë,(4), 
la fonction matricielle 


rar S), dial, N 
Dia(, 5), Das, 5) 


est définie positive : pour tous les x, Xe, . ++, Xas Vas ces Vas ps far os là 
on a 
& 


D Cha XX y + Dual 19) (XF X 90) ++ Bas Gays) > 0. (1.1) 
d,j—i 

Toute fonction opératorielle symétrique définie positive est fonction de 
corrélation d'un processus. Donc, la condition (1.1) est nécessaire et suffi- 
sante pour que b;:(/, s) soit fonction de corrélation mutuelle des processus 


E(e) et Ea(e). 


9,1.3. Continuité stochastique. On dit qu'un processus aléatoire £(r) 
défini sur un intervalle T est stochastiquement continu en un point #,€T 
si pour tout € =- 0 

lim P{I£()—E(0)l > €} = 0. 


tv te 


Si un processus est stochastiquement continu en chaque point d'un inter- 
valle 7, on dit qu'il est stochastiquement continu sur l'intervalle T. (Cette 
définition est valable pour les processus numériques et vectoriels. Dans le 
dernier cas, le symbole |: | désigne la norme du vecteur). Soit é(r) un 
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processus stochastiquement continu sur 7. On a les propositions suivan- 
tes : 

a) sû S(4, X) est une fonction continue pour 1CT, x EX, où Xest le 
domaine de valeurs de Et), alors f(t, Ë(t)) est aussi un processus stochastique- 
ment continu sur T ; 

b) si pour un à — 0 


sup E|/(r, &0))[1 19 << © 


où f'est une fonction telle que celle définie dans à), alors la fonction Ef(t, £(0)) 
est continue en t ; 

C) soient f une fonction définie comme dans a), À(i) une fonction nu- 
mérique non négative telle que (H) t 4: avec h. Si 


sup E/(t, 0) (IS (4, E))1) < © 


alors Ef(+, € (t)}est une fonction continue ; 

d) si sup E |é(r)1*9 < pour un à = 0, les moments du processus 
E()-mts, ..., 1j) pour j < K sont continus par rapport à toutes les varia- 
bles ; 

e) si E(t) est un processus stochastiquement indépendant sur T (fermé 
borné) il est uniformément stochastiquement continu, c'est-à-dire pour tout 
E > 

lin sup P{I£G@,)-4(4.)1 = €} =: 0 ; 
A0 .nCr 
In-nfeA 


f) le processus (+) est stochastiquement borné sur T'si 
lim sup P{I£(r)] > c} = 0. 
CT 


€e—v + © 


Si un processus est stochastiquement continu sur T (fermé borné), il est 
borné stochastiquement. 


9.1.4. Processus à espace des phases discret, 1e domaine de valeurs du 
processus cest souvent un ensemble dénombrable. (Exemple : le processus 
prend des valeurs entières ou bien ses valeurs sont des vecteurs à coordon- 
nées entières, etc.). La forme de l'espace des phases de ces processus im- 
porte peu. Supposons que le domaine des valeurs X est composé des élé- 
ments {x;,, x: ...} et que T'est le domaine de définition du processus. 
Il est alors commode de définir les lois finidimensionnelles du processus à 
l’aide des probabilités 


Pr sk = P{Ë() = x, (LS) = x} 
20! 


1l est évident que si l'on connaît ces probabilités on peut définir les lois 
finidimensionnelles du processus par la formule 


FA: 2e A4) = D Pa (n es AK). 


*E, € Ayo ..., af € 4h 


9.1.5. Processus à temps discret. On dit qu'un processus £(1) est à temps 
discret ou est une suite aléatoire si son ensemble de définition T est une 
suite de nombres entiers non négatifs, ou la suite de tous les entiers. 

Soit T = {0, 1, 2, ...}. On écrira &, au lieu de £(n, w). Les lois finidi- 
mensionnelles de la suite {Ë,} sont éntièrement définies par les fonctions de 
répartition 

F (A0 ... A.) = P{é € À ..) £, € À,). 


Au lieu de ces fonctions il est parfois préférable de donner les fonctions de 
répartition conditionnelles de £, sachant &,, ...,£,_;, : 


FE(A/Xos 5 Xn- 1) 

c'est-à-dire des fonctions telles que l’on ait presque sûrement 
P(É, € AJ£o ..., 5-3} = FA Eos » 5 En 1). 
SiT = {0, +1, +2,...}, on sc sert des lois finidimensionnelles 
FA un ee 0 Au eee A) = Po € Aa F1 € An € Aonmec.., 

EE AE. CA}. 

On peut également les définir avec les lois conditionnelles 
PÉSEA/E EE ones ils 
PLU E AJEos Ep Ë 10 2 +05 Sn ho Sn 4 190). 


Exemples de processus aléatoir 

a. Sur l’espace probabilisé (9, G, P), où {2 est l'intervalle {0, 1], &, 
la tribu des boréliens de cet intervalle, P, la mesure de Lebesguc sur [0, 1), 
on définit un processus Ë(s, w), 1 € [0, 1], par 


1, 1-0; 


(4, ©) = D ee 


Les lois finidimensionnelles de ce processus (dont l'espace des phases est 
composé des points 0 et 1) sont définies par les relations : 


P{É(,) = 0,...,8G:-1) = 0, EG) = 1,...,Ë0,) = 1} = Gti; 
pour ty <to <= o.. <= fn et 
P{Ë(,) = 0, ..., ë(,) = 0} = 1-1, ; 
P{É(,) = 1, ..., #4) = 1}=n 
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pour 1 < i = n. Dans tous les autres cas P{i(1,) = K,, ..., Ë(2,) = k,}) = 0 
(k,, ...,K, prennent les valeurs 0 ct 1). 
Le processus &(r) est stochastiquement continu : pour e < 1,1, <f; 


P{IË(2) — (4) rs €} = P{É(1:) = 0, (12) Fa 1} = fai. 


Cependant les réalisations du processus sont presque toutes discontinues. 
Cet exemple montre que la continuité stochastique du processus n’entraîne 
pas la continuité des réalisations. 

b. Processus de Poisson. C'est ainsi qu’on appelle un proccssus &(#f) 
défini pour s = 0 à valeurs entières non négatives dont les lois finidimension- 
nelles sont définies par 


P{È(,) = k, EC) = ka... E(,) = K,} = 
ave” in (2 1)" ce (un ln- 1)” : 
= kRlGs-k)t... (K-ks-)! 
0 
si 0O<Kk,=k:<...<k,; 


O=1,<... <1, Ce processus décrit le nombre des événements rares 
qui se sont déroulés au cours d’un intervalle de temps # (par exemple, le 
nombre de particules cosmiques enregistrées par un compteur, le nombre 
d'appels téléphoniques dans un central, etc.). Le nombre a = 0 


_ EH) 
EE 


est appelé paramètre du processus. 

Le processus de Poisson se construit de la manière suivante. Soit 
Mu 7e -- Une Suite de variables indépendantes non négatives identiquement 
réparties, telles que 


PU > 1} = pr, 
Sie(z) = 1 pour z == 1, e(z) :- 0 pour z < 0, alors la fonction 
& 
È(t) = ?. e(r- Y n) 
E= 1 (1 
est un processus de Poisson (cette formule définit le processus comme une 
fonction de r et de w, puisque 7, dépendent de w). 


c. Processus de croissance pure. Supposons que les », sont ceux de 
l'exemple précédent et que /, — Oest une suite telle que 


1 
2e 
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On appelle processus de croissance pure un processus de la forme 


eæ k 
ë(t) = 1 .) 
0 À À a}, 

{cs réalisations de ce processus sont des fonctions en escalier non décrois- 
santes, à valeurs entières, dont les sauts sont tous égaux à 1, &(0) = 0. 

d. Mouvement brownien de dimension un (processus wienérlen), C'est 
ainsi qu'on appelle un processus w(#) défini pour ? = 0 dont les lois finidi- 
mensionnelles sont définies par les densités de probabilité conjointes des 
variables w(#,), w#3), ..., n,) pour f, < 1: < ... <1,, ces dernières 
étant de la forme 


Lo ee x) 2 [Qt t) ee (rt TE X 


| Ni (x3—x1) : | (x, : 1) } 
xexp { 2 F? tt Fe 11, ; 


LC processus w{(#) peut servir de modèle probabiliste des phénomènes 
dc diffusion ou du mouvement brownien (u{r) est l'une des coordonnées de 
la particule en diffusion). 


9.2. Mesurabilité ct intégrabllité des processus aléatoires 


9.2.1. Processus aléatoires mesurables. On dit qu'un processus aléatoire 
€(t, w) défini sur un borélien T, à valeurs dans l'espace des phases Y, est 
mesurable s’il est mesurable par rapport à la tribu D,XS, où S, est la 
tribu des boréliens de T ; ©, la tribu des événements de l’espace probabilisé 
(9, ©, P) sur lequel cest défini le processus aléatoire. Ceci traduit le fait que 
pour tout borélien À © X 


{(G ; w): Et, m)CAÏCYWXG 


(le produit des tribus % et © est la plus petite tribu contenant les ensembles 
BXS, où B € B,S € ©). 

Si un processus &(#, o) est mesurable, ses réalisations £(-, w) sont des 
fonctions borélicnnes de # pour presque tous les «. 

Les processus construits avec les lois finidimensionnelles du théorème 
de Kolmogorov (cf. n° 9.1) ne sont pas mesurables. 11 se pose la question 
de savoir sous quelles conditions peut-on construire un processus mesurable 
à l’aide de lois finidimensionnellcs. 

Nous allons nous servir de la notion d'équivalence stochastique de 
deux processus aléatoires (notion qui diffère de celle d'équivalence stochas- 
tique au sens large définie au n° 9.1). On dit que deux processus £ (1) et 
&a{t) définis sur un même espace probabilisé (9, ©, P) et à valeurs sur un 
même ensemble T sont stochastiquement équivalents si 


P{£() = &:0)} = 1,  VtET. 
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Les processus stochastiquement équivalents admettent manifestement les 
mêmes répartitions finidimensionnelles. 

Théorème 1. Si un processus E(t) est stochastiquement continu sur un 
borélien T, il existe un processus mesurable E’(t) stochastiquement équivalent 


à &(e). 
Le processus &’(f) peut être défini comme la limite des processus 
£,(t) = ta) pour Elu lsih Où ta ET et max les al —+ 0. 


On admet que £’(r) = 0 pour les couples (f, w) pOur r lesquels cette limite 
n'existe pas. 

Corollaire. Si £(r) possède un ensemble au plus dénombrable de points de 
discontinuité, il existe un processus mesurable £‘(t) stochastiquement équiva- 
lent à E(r). 

Voici quelques propriétés importantes des processus mesurables. 

a. Soit g{?, x) une fonction B,-X8,-mesurable, où 8, est la tribu 
des boréliens de l’espace des phases X du processus étudié. Si 


E CUT £(t:))| .….. [g(rs, E(t:))| < ©, Vlu ….. dr € À, 
la fonction 
gt .. t) = Eg(", 4(n) se gr Ë(t:)) 


est borélienne, c'est-à-dire 95-mesurable. 
En particulier, touts les moments d’un processus mesurable sont 


boréliens. 
b. Si g{r, x) est une fonction bornée 8; X8,.-mesurable, alors l'in- 


tégrale 
[ œ(e, EG, w)) de 
r 


existe pour presque tous les &, est S&-mesurable et 
E [o(s, é(, o)) dr = [ Er, EG, w)) dt 
r Tr 

(cette proposition est une conséquence du théorème de Fubini). 

c. Si ElË(, œ)| < c et [EjE(, &)] dt < co, l'intégrale [ £(r, w) dt 

r  d 

existe pour presque tous les «. 
9.2.2. Intégration des processus aléatoires. Soit £(1) un processus aléatoire 
mesurable réel stochastiquement continu sur l'intervalle [a, b]. Indiquons 


les conditions sous lesquelles les réalisations £(#) appartiennent presque 
sûrement à L, (a, b], où 0 < p = 2, c'est-à-dire 


d 
eff LÉ(E)1 dt < =| = 1. (2.1) 
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Désignons par (ge) la fonctionnelle caractéristique du processus : 
è 
48) = E exp { [EQ a) 


définie sur les fonctions en escalier g sur [a, b]. 
Soient par ailleurs ?,, = a+ (b—a),k =0,...,n; No, is +0 ns e » + 


des variables aléatoires indépendantes uniformément réparties sur [0, 1] : 
Cor Gr 5 En» +. des vecteurs aléatoires indépendants entre eux et de 
Nos T1 - - et tels que 


Ee “"*t = e”l1? 
(c'est-à-dire &, admettent une loi symétrique stable d'exposant p). 
Considérons le processus 


vP() = TS en efr-1,- 2" ) 


F n'» 


sur [a, b], où e(s) = O pour sr < 0, ef) = 1 pour > 1. 

La quantité (Âr?) est définie, puisque »?Z(r) est une fonction en escalier 
sur [a, b]. La fonction :?(-+) étant aléatoire, la variable (Ar?) l'est égale- 
ment. 

Pour que (2.1) ait lieu, il est nécessaire ct suffisant que pour tous les 
À > Oexiste la limite 


y(2):= lim Ey(2r?), 


A2 


qui est telle que y(0+) = 1. De plus, 
d 
ru 
y{4) = cop Ï core) 


Supposons que &() appartient presque sûrement à L,[a, b], p= 1. 
Sous cette condition, pour toute fonction mesurable bornée g{t) sur [a, b] 
est presque sûrement définie l’intégrale 


i Er) go) dt. 


Donc, pour un tel processus, est également définie la fonctionnelle carac- 
téristique 


è 
47) = E exp l J #0) g0@) a 
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Les fonctionnelles caractéristiques 7,(;) et z(g) sont liées entre elles par les 
relations suivantes : 
1) 17) = lim E{r,), 


nm —+ no 


où », est une suite de fonctions aléatoires sur {[a, b] de la forme 
"= b—a b-a b—a 
g(r+ Em) e(r-1,- : mn). 


n 
où 7, est une suite de variables indépendantes uniformément réparties sur 
[0, 1 


M, = 


2) sié(r)est un processus stochastiquement continu, alors 


x@) = lim z(7,), 


AR —+ © 


où p, est une suite de fonctions mesurables telle que 
feu) ds -+ 80080). 


Etudions à titre d'exemple le processus du mouvement brownien w(#). 
Pour ce processus 


1 1 
x) = exp} > [ | min fe, s1 dete) des}, 
CE 
d'où 


1 1 
47) = | + Î | min {, s] gt) gs) dt ds\. 
0 0 


9.3. Séparabilité. Propriétés des réalisations 


9.3.1. Définition d’un processus séparable. La notion de séparabilité joue 
un rôle important pour reconnaitre si les réalisations de processus aléatoires 
sont par exemple continues et bornées. La connaissance des valeurs des 
processus aléatoires séparables seulement sur un ensemble dénombrable de 
valeurs de # nous renseigne sur le comportement des réalisations pour tous 
les #. Etant donné que la connaissance des lois finidimensionnelles ne permet 
de déterminer que la probabilité des événements, rattachés à un processus 
aléatoire, qui sont définis par les valeurs de ce processus sur un ensemble 
dénombrable, si l’on n'utilise pas la séparabilité, alors il nous est impossible 
de définir la probabilité, par exemple, que le processus soit continu (ou ne 
présente pas de discontinuités de seconde espèce), borné ou dérivable. 

Soit Ë(t), 1 € T un processus aléatoire à valeurs dans l'espace des phases 
À, défini sur un espace probabilisé (9, ©, P). On dit que ce processus est 
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séparable s'il eviste un sous-ensemble I € T dénombrable, dense dans T et un 
ensemble À € €, P(A) = 0, tels que pour tous les ensembles fermés F & X 
et tout intervalle }æ, f l'on ait 


{o: Et) EF,t1E la BND -{o: EG o)EF,1C la, A(INT) € À. 


L'ensemble I s'appelle ensemble de séparabilité du processus. 


Si £(#) est par exemple un processus aléatoire numérique séparable sur 
{a,blet 7 = {1,,...,1,,...} alors 


à sup ë(r) «| = Pfur (A =:l = lim rec) <x,...,E(t,) <a) 


<t<b tk n —+ © 


Il s'avère qu'on peut toujours rendre un processus séparable en passant 
aux processus stochastiquement équivalents. C’est ce qu'affirme le théorè- 
me suivant de J. L. Doob. 

Théorème 1. Soient £(t) un processus aléatoire dont l'espace des phases 


X est un espace euclidien de dimension finie, X une extension compacte de X. 


Il existe alors un processus séparable £"(t) à valeurs dans ? stochastiquement 
équivalent à E(t). 
X étant localement compact, il existe toujours une extension compacte 


X. Si, par exemple, X est la droite, en lui ajoutant les points + on ob- 


ticnt X. 

Bien que dans le cas général il soit impossible d'indiquer l'ensemble de 
séparabilité d’un processus donné, on peut néanmoins pour ensemble de 
séparabilité des processus stochastiquement continus prendre n'importe 
quel ensemble dénombrable partout dense 7 € T. 


9.3.2. Processus continus. Si (F,,S,) est l'ensemble de toutes les fonctions 
définies sur 7 ct à valeurs dans X, ©, la tribu engendrée par les ensembles 
cylindriques, C’; l’espace de toutes les fonctions continues sur T'et à valeurs 
dans X,' alors C’; n'appartient pas à ©, pour les T non dénombrables. 
Donc, si un processus est construit comme dans le théorème de Kolmogorov 
(n° 9.1), la continuité de ses réalisations n'a pas de sens. Si le processus est 
séparable et l'ensemble T fermé, l'ensemble de continuité des réalisations 
est mesurable, puisque 


P({o : E(-,m)EC,) = 


Le al > 


DE < A U A {o: LEE, co) Es, em) <= " 


mal k=-1 t,6€7 


L 
le «| < -— 
k 


Test l'ensemble de séparabilité du processus. La dernière probabilité est la 
probabilité des réalisations continues. Pour que les réalisations d’un pro- 
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cessus séparable soient presque sûrement continues, il est nécessaire et 
suffisant que pour un ensemble 7 dénombrable dense T l'on ait 


P a) Ü A, {o: [EG &)—8(s, w)1 < =) = Î. 


t— PE 


La vérification de cette relation implique la connaissance de toutes 
les lois finidimensionnelles et, en général, est impossible à faire. Le théorème 
suivant de Kolmogorov fournit des conditions suffisantes commodes de 
continuité d’un processus. 

Théorème 2. Soit &(r) un processus séparable défini sur {a, b]. Si existent 
a > 0,8 > Oet Ktels que pour tous les t, s € (a, b] 


EË()-E(s)1 = Kit-s|'+8, 


alors (+) est presque sûrement continu. 

Voyons comment s'applique ce théorème à la continuité d’un processus 
wienérien. On sait que pour un tel processus la quantité w{#)—w{s), ? > 5, 
admet une loi normale de moyenne nulle et de variance f—s. Donc 


Pur) -- ns) < x} = PS | e 4-9 du; 
LE u()-u(s)|® = en | lulse X1-9 du = 
= |t-s|#? [ MES, 
4/2x 


Les conditions du théorème de Kolmogorov sont réunies si « > 2, f = 
= 3 1. Par suite un processus wienérien séparable est presque sûrement 
continu. 

9.3.3. Processus sans discontinuités de seconde espèce. Soit Æ£(f, w) un 
processus défini sur [a, b] et dont l'espace des phases X’est un espace eucli- 
dien de dimension finie. Désignons par D l’ensemble des fonctions x(#) 


définies sur (a, b], à valeurs dans X, admettant des limites à droite pour 
1€ [a, b[ et à gauche pour t € Ja, b]. Les fonctions de D ne présentent pas 
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de discontinuités de seconde espèce. Pour qu'une fonction x(f) ne présente 
pas de discontinuités de seconde espèce, il faut et il suffit que 

lim sup min (|x(s)—x()1, 1x(u)— x(s)1) = 0. 

A0 est <u<ttA sd 
Soient £(1, w) un processus séparable, / son ensemble de séparabilité. On a 
presque sûrement 


sup min ([£(s, &w)— &(4, w){, | EG, ©) — Es, w)|) = 


egi<ieuaith sb 


= sup min (I£(s, w)—Ë(t, w)1, 1£(u, w)— Es, w)|). 
Me 


Donc, une condition nécessaire et suffisante pour que les réalisations d’un 


processus séparable appartiennent à D, c’est-à-dire pour que ce processus 
ne présente pas presque sûrement de discontinuités de seconde espèce, est 


P A Ü N {o: LE(S, ©) — E(t, w) | << —}u 


OAI. 
1 
PAPERS et 


U{o : (4, ©) — E(s, w)l = 2} = À, 


Pour vérifier si une fonction appartient à D, on peut se servir de son nombre 
d’e-oscillations. On dit qu’une fonction x(#) présente sur [a, b] au moins 
k e-oscillations si existent des points fo < /, < ... < t,tels que 


Xi) — x) | > €, i = 0, ... k—1. 


Pour que x(-) € D, il faut et il suffit que x(r) présente sur [a, b] un nombre 
fini d'e-oscillations, quel que soit € = 0. 

Si E(f, w) est un processus séparable, 7 son ensemble de séparabilité, 
alors &(:,w)€ D presque sûrement pourvu que ë(:,«) admette presque 
sûrement un nombre fini d'e-oscillations sur 7 quel que soit e > 0. Soit 
1= U 1,, où Z, est une suite croissante d'ensembles finis. Si », est le nombre 


n 
d'e-oscillations sur 7 et v* le nombre d'e-oscillations sur 7, alors », = 
= lim ww. Sachant la loi conjointe des variables &(r,), ..., £(r,), où 


8 —+ © 
1, = {tr ne 1} on peut calculer la loi de »® puis, par un passage à la 
limite, celle de », et enfin vérifier la condition P{v, < ©} = 1. 
Les conditions de non-existence de discontinuités de seconde espèce 
indiquées ci-dessus impliquent la connaissance de toutes les lois finidimen- 
sionnelles du processus et le calcul des probabilités d'événements assez 
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complexes. Indiquons quelques conditions suffisantes aisément vérifiables 
de non-existence de discontinuités de seconde espèce. 

Théorème 3. Soit £(t) un processus séparable sur un intervalle [a, b] pour 
lequelexistent « > 0,f > Oet Ktels que 


E(I£() — Es) 1 LE(S) — 80) 1) < Ki — 1)! + 


pour t = s < u. Alors le processus £(t) ne possède presque sûrement pas de 
discontinuités de seconde espèce. 

Voyons à titre d'exemple un processus poissonnien de paramètre a. 
Les quantités £(w)—Æ£(s) et £(s)—£Ë(1) sont indépendantes. En prenant 
a = |,onaura 

E 1£(u)—&(s)1 1£(s)—Ë0)1 = ElË£G)—Ë(S) 1 EIË(S) —Ë()1 = 
= aUu-s)(s-1) = a{u-t}. 

Donc, les conditions du théorème sont remplies pour &« = 1,8 = 1, X = a°, 
Par suite, un processus poissonnien séparable ne présente pas de discontinui- 
tés de seconde espèce. 

Le théorème suivant utilise les lois conditionnelles du processus. Soit 
Ë(s) un processus quelconque. Désignons par &° la plus petite tribu par 
rapport à laquelle sont mesurables £(u) pour u < 1. 

Théorème 4. Soit £(t) un processus séparable défini sur [a, b]. Si existe 
une fonction (non aléatoire) g {h), € > 0, h > 0, telle que œ,(h) 10 pour 
h10et presque sûrement, 


Pièce+n)£(0)1 > el%E} = ph) 


alors le processus E(t) ne présente presque sûrement pas de discontinuités de 
seconde espèce. 

Ce théorème est commode pour les applications aux processus à 
accroissements indépendants. C'est ainsi qu'on appelle tout processus 
ë(r) tel que Et), Et) —Elto), ..., (a) —Ë(:-,) sont indépendantes pour 
lo <<... < {,. Pour les processus à accroissements indépendants, la 


quantité £(s + 4) — £(r) ne dépend pas de la tribu &Ÿ(4 > 0), donc 
P{ié(e+1)—E0)1 > e/gf} = PE +M—EH0)1 > €). 


Comme tout processus stochastiquement continu est uniformément 
stochastiquement continu, on a 


lim sup P{IE( +4) E(1)1 = €} = 0. 


AO e<t<ttA<b 


Donc, tout processus séparable stochastiquement continu à accroissements 
indépendants ne possède presque sûrement pas de discontinuités de seconde 


cspèce. 


9.3.4. Conditions de continuité pour processus sans discontinuités de seconde 
espèce. Soit x(#) une fonction de D. Choisissons une suite de partitions de 
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fa, bia to --ta- ... -21,,:: b telle que max (4,1 —1,r) — 0. Si 
x 


n, est le nombre de sauts de x(1) supérieurs à € > 0, alors 


nm -1 

M == lim y. «l (ru +3) — x), 
n-> > Ek=-0 

où 7, est l’indicatcur de l’ensemble 4. Donc, si l'on désigne par v, le nombre 

de sauts d’un processus aléatoire £(#, ) supérieurs à & > 0, on aura 


nm -Î 
Er = lim À Egy, (Ou +1) —EGu)l) 


n-»> E-0 
[a 2 


Le lin , PUS i )—E()| Fe E}. 


Pour que le processus soit continu, il est nécessaire ct suffisant que 
r, = 0 pour tout € = 0. Donc, pour qu’un processus ne présentant 
presque sûrement pas de discontinuités de seconde espèce soit continu, il 
suffit que 


m-1 
lion D PAG n)l :- €} = 0, Ve > 0. (3.1) 


Comme un processus séparable à accroissements indépendants ne présente 
pas de discontinuités de seconde espèce, si seulement il est stochastiquement 
continu, ct que la condition (3.1) entraîne la continuité stochastique, cette 
condition est suflisante pour que le processus &(r) soit presque sûrement 
continu. Il se trouve que cette condition est aussi nécessaire à la continuité 
d’un processus à accroissements indépendants. 

La condition (3.1) est nécessaire et suffisante pour qu'un processus sé- 
parable E(t) à accroissements indépendants soît presque sûrement continu. 


9.4, Continuité ubsoluc des mesures associées 
aux processus aléatoires 


9,4,1. Mesures associées aux processus aléatoires. Soient &(9, 1€ T, un 
processus aléatoire à valeurs dans l’espace des phases X, F4 l'espace de 
toutes les fonctions (1) définies sur T à valeurs dans #, ©. la plus petite 
tribu de parties de F,; contenant tous les ensembles cylindriques. On 
appelle mesure associée au processus #(-) la mesure ye définie sur ©; 
par la relation 


(A) = P{ÉC)EA}  AEGr. 
Au lieu de F; on considère parfois un autre ensemble de fonctions (par 
exemple l'espace #4 des fonctions mesurables, l’espace D. des fonctions 


sans discontinuités de seconde espèce, l'espace C'? des fonctions continues) 
tel que les réalisations du processus lui appartiennent presque sûrement. 
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Toute fonction @,;-mesurable y{1(-)) définit une fonctionnelle de pro- 
cessus, c'est-à-dire unc variable aléatoire 7{Ë(-)). Supposons qu’un processus 


appartient presque sûrement à D,. Ces fonctionnelles seront par exemple 


sup |#()1,  [7(e EC) dr, 
‘Er r 


où /(f, x) est une fonction mesurable bornée. 

Si l’on connaît la mesure associée à un processus, on peut déterminer 
la Joi de toute fonctionnelle de ce processus. On peut se servir à cet cffet 
de la formule : si g(x(:)) est une fonctionnelle ©;-mesurable bornée, alors 


EC) = [Go dx). 
Fr 


Donc, pour toute fonctionnelle G;-mesurable g(1(-)), la fonction carac- 
téristique de la variable 7(£(-)) est définie par 


Ec:7G0)) = f ed x). 
Fr 


9,4,2, Continuité absolue des mesures. La théorie des mesures étudie la 
continuité absolue (ou la singularité) des mesures associées aux processus 
aléatoires. Indiquons les définitions nécessaires. Soient X un ensemble, % 
unc tribu de ses parties. Le couple (X, 8) s'appelle espace mesurable. Soient 
données deux mesures y et v sur (X, 8). On dit que la mesure jt est absolument 
continue (et on note y &v) par rapport à v si (A) == 0 pour tous les 
A € tels que »(A) := 0. Si pu << v et v << jt, on dit que pet v sont équiva- 
lentes (et on note pa = v). Les mesures ju et v sont singulières ou orthogonales 
(y L v) si existe un ensemble S € B tel que n(S) =: 0, v(X\S) =: 0. Quelles 
que soient y ct v, on a toujours la représentation y = ptit pts, v = +, 
OÙ Yty © Pis fs LV, Va LH. 

Thévrème de Radon-Nykodym. Si ye ef v sont des mesures finies et 
nu << v, ilexiste une fonction p(x) B-mesurable telle que pour tous les À € D 


l'on ait 
11(A) = fe (dx). 


A 


Cette fonction est définie de façon unique à un facteur multiplicatif de mesure 
nulle v près ; ex) est la densité de la mesure jt par rapport à v ou dérivée 


dy 
et se note - ve (x). 


Pour les processus aléatoires on doit étudier les conditions : 1) de 
continuité absolue d'une mesure par rapport à l’autre ; 2) de singularité 
mutuelle des mesures ; 3) si le processus est absolument continu, il faut 
calculer la densité d'une mesure par rapport à l’autre. Indiquons les applica- 
tions susceptibles de résulter de l'étude de la continuité absolue. 

Si l'on sait que be, & He, POUT deux processus aléatoires £.(1) et 


&.(t), tout événement qui a lieu presque sûrement pour le processus &,(1) 
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aura lieu presque sûrement pour &,(#). Si, en particulier, les réalisations du 
processus £,(t) possèdent presque sûrement certaines propriétés (sont con- 
tinues, ne présentent pas de discontinuités de seconde espèce, sont mesura- 
bles, dérivables, etc.), ilexiste un processus £,(#) stochastiquement équivalent 
à E(r) dont les réalisations possèdent presque sûrement les mêmes pro- 


dfte 
priétés. Si, de plus, l’on connaît la densité die & (x: )), on peut ramener 
He, 


le calcul des espérances mathématiques des fonctionnelles du processus 
&,(-) à celui des espérances mathématiques des fonctionnelles de &.(:) 
grâce à la formule 


Ey(#1(-)) = Ey(EC)) CO) 


Cette formule permet de calculer aussi les se des fonctionnelles : 


di 
P{(60)) = 4} = En a(r(é0))) = En, a (7(E2C-))) ue 0) 


OÙ Y1- s, 4 CSt l'indicateur de l'intervalle ]— co, [. 
Si l'on sait que le, Lu et pour quel ensemble je, (S)= let le, (S) = 0, 


on peut alors soute le problème de statistique suivant. On observe 
un processus (1), # € T, dont on ignore les lois finidimensionnelles. On sait 
sculement que la mesure qui lui est associée est soit He, Soit 71, On demande 


sur le vu des observations d'indiquer cette mesure. (Exemple : si l'on détecte 
un signal sur un fond de bruit aléatoire, le, cs la loi du bruit pur, le, celle 


du signal avec bruit. On demande d'établir sur le vu des observations la 
présence ou l'absence du signal). La solution de ce problème est visiblement 
la suivante : si i(-)€ S, on admet que He = be si é(-) € S, alors y, = les 


9.4.3. Continuité absolue des mesures associées aux processus aléatoires. 
Soient £,(r) des processus définis et stochastiquement continus sur un 
ensemble 7, 7, une suite croissante de sous-ensembles finis telle que UT, soit 
dense dans T. Désignons par ©, la tribu engendrée par les ensembles 


cylindriques de bases dans T.. Si T. = {ts ..., t,} les ensembles À 
de @, sont de la forme 


x) OC: \(£a,)) € B,.}, 
où B, est un ensemble borélien de R', espace euclidien de dimension k,, 
sis X,) est le point de cet espace de coordonnées x. 
DérpA ons par ge" la restriction de la mesure y, à la tribu G, 
La mesure Tr est définie de façon unique par la fonction 


Fa. 7 ...s A) S P{£,(4,) EAp... Et.) € Ai} 
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On a les propositions suivantes : 
1) si y, << jte, alors pour tous les n ITS </te 1" 


ecran (Air RE A.) cu 
= fa. fatrsx) F2 (dinde) QD 


mé CO) = (Su) 2 Cu) 


2) soit 85: la tribu engendrée par £,(r,,), i = 1, ...,k.Ona 
dpe" ; dite 
—" (6,0)) = El —"(é,( RE 
due” ds : (es di è 5e, 


3) supposons que pour tous les # existe une fonction g, telle que (4.1) 
soit réalisée pour tous les boréliens 4,, ..., 4, de R'. Alorsilexiste presque 


sûrement la limite 
(U = lim EACON] CO a). 
n —+ © 


Si, de plus, Es = 1, alors be, € Hg, © 


4) Ti a ‘existe une fonction g, telle que soit réalisée (4.1), 
On = Ea(Sa) » (la) et la suite op, soit équiintégrable. Sous ces 


conditions Ep = 1. Ceci aura lieu, en particulier, si pour une fonction 


y(2) telle que y(À) t + > pour Àt +, sup Es,y(n,) < (par cxemple, 


sup Ep = pour un certain « - | 
5) supposons que les fonctions g, vérifiant (4.1) sont positives. La limite 


Gi EE) ee CT 


existe alors presque sûrement. Si P{e, = 0} = 0, alors y, + ft et 


die, de, 
Re EO)= eee 7e GO) 
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Exem P le. Soient &.(r) = ur), E,(r) = w(r)-+a(r), où w{r) est un 
processus wienérien, a(t) une fonction continue, 40) := 0. Trouvons les 
conditions pour lesquelles le El si T = (0, 


Supposons que 7, — Ge k=0, 1, 2" 7. En utilisant le fait que 
a()- -4(>), k=0,...,2"— 1 sont indépendantesentre clles et admet- 
tent une loi normale de variance _ ct de moyennes : 0 pour 5 - 2 ct 

K+1 k 
()-a(: :) pour i =: 1, on s'assure que 
2" 2" 
r i Lt 
dyue, HO) = 2 ( — () , 
W{(:)) = ial—|l-al—)|1X 
du" km0O | 2 2" : 


k+1 k\T 12-11 kg) all] 
Le Est) 
2*- 2" 2 £=0 2° 2" 2" f 

Cette quantité admet une limite non nulle si 


CRC PUIS 


Cette condition entraîne l'existence de la dérivée de carré sommable «’(r) 
et de plus 


an SELS - firore 
de, De()-(OI (I [rod 


(cette intégrale est définie au n° 19.2). 
Donc 


1 
p = Cxp [rw dw(t + Î {a’()}? dt ?. (4.2) 
0 0 
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i 
Eo = 1, puisque [a’()dwr) suit la loi normale de moyenne 0 et de 
0 


il 
variance [RCLO)L dt. Donc, le second membre de (4.2) nous donne la 
0 


dy 
densité ae si existe la dérivée de carré sommable «’(1). Dans le cas 
£a 


contraire ft L fi. 


Chapitre 10 
THÉORIE DE L'ESPACE L, 


10.1. L'espace L,(9, ©, P) des variables 
aléatoires hilbertiennes 


10.1.1. Définition. Convergence. L'ensemble des variables aléatoires £ 


à valeurs complexes, définies sur un espace probabilisé (9, ©, P) de mo- 
ment d'ordre deux E|£|? < , forme un espace vectoriel hilbertien normé 
L,(9, &, P), muni du produit scalaire 


(£, 7) — Et (1.1) 


et de la norme 
HÈI — (EIS EF). (1.2) 


La norme sert à définir la distance de deux variables aléatoires de .L,(0, 


| o(Ë, n) = llË-nII. 


Les variables aléatoires £ appartenant à £. — L.(9, ©, P) s'appellent 

variables aléatoires hilbertiennes. 
ë Les variables aléatoires hilbertiennes £ et 7 sont orthogonales si 

E éñ = 0. 
Cette définition de £.(9, ©, P) subsiste dans une situation plus géné- 
rale pour les éléments aléatoires à valeurs dans un espace hilbertien complet 
mesurable #, dans lequel £n est le produit scalaire et | £ |? — £ë. 

Dans 2,(9, ©, P), la convergence est une convergence en moyenne 
quadratique : 


Lim. Ë£, = à, 


n > © 
si lim |l£,—£1I = 0 ou, ce qui revient au même, 
nn —+ © 
lim Elé,-ff-0 
nm —> OO 


La convergence en moyenne quadratique (m.q.) entraine la con- 
vergence stochastique. La réciproque cst fausse. 

Cependant, si |Ë,|<7€.L,, la convergence stochastique de &#, 
entraîne la convergence en moyenne quadratique. 


10.1,2. ea rar caractéristique. Une fonction aléatoire hil- 
bertienne {Q (x), x €} est définie par un ensemble de variables aléatoires 


218 


hilbertiennes &(x) dépendant d'un paramètre x à valeurs dans un ensemble 
de paramètres ‘©. 

On pee covariance B(x, y) d’une fonction aléatoire hilbertienne 
{6(x), x €} la fonction 


B(x, y) = ELEC); x,» ED. 
La covariance B{x, y) est une fonction définie positive : 
D Br, x,)z2, = 0 
,Fæil : 


pour tous > 1, x, €‘Ù, et les nombres complexes z,. De plus, 


n ‘@ 
2 C(Xs)22 


Y BC, X/)212e = E 
1 


&,r = 


La définition positive est une propriété caractéristique de la cova- 
riance. 

Théorème 1. Pour qu'une fonction B(x, y) soit covariance, il est néces- 
saire et suffisante qu'elle soit définie positive. 

On appelle propriétés de covariance ou propriétés du second ordre les 
propriétés des fonctions aléatoires hilbertiennes exprimées en termes de 
covariance. 


10.1.3. Continuité d’une fonction aléatoire. Soit © un espace métrique 
muni d'une métrique 0. 

Définition 1. On dit qu'une fonction aléatoire hilbertienne {4(x), 
x E ©} est continue (en moyenne quadratique) en un point x, si 


E16(x)—6(xo) | > 0 pour px, xo) —+ 0. 


Théorème 2. Pour qu'une fonction &(x) soit continue en xo, il faut et il 


suffit que la covariance B{x, y) = EC(x) 60) le soit au point (xo, Xo). 
Corollaire. Si la covariance Bx, y) est continue en chaque point 
diagonal (xe, xo) E‘ÜX' 6, elle l'est en tous les points (x, »» ED XD. 
On remarquera que la continuité en m.q. de la fonction &(:v) n’entraîne 
pas la continuité de ses réalisations. 


10.1.4, Dérivabilité d’une fonction aléatoire. Soit x = Ja, b[ un intervalle 
de l'axe des réels. 

Définition 2. On dit qu’une fonction aléatoire hilbertienne {6(x), 
x E ©} est dérivable (en m.q.) en un point x,, si existe 


G'Cxo) = Lim. + LECro+ )-E(o)] 5 Xos Xoth€ Ja, b. 


La variable aléatoire &’(x.) est la dérivée (en m.q.) de la fonction 
aléatoire £(x) au point x. 
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Tiéorème 3. Pour qu'une fonction aléatoire hilbertienne {$(Xx), x € Ja, H(} 
soit dérivable en tout point x, € Ja, b[, il faut et il suffit qu'existe la dérivée 
mixte distributionnelle du second ordre de la covariance 


2 
D = ne FH [B(xo+ 4, Xo+ 1) — 
— B(xo, Xo+ 4) — B(Xo th, Xo) + B(Xos Xo)l. 
De plus, 
dBx, y), 
Ov dr ” 


EL’(x)ÈC) = 2e 2 


EC (x)Ë O7) — 


10,1.5. Intégration d’une fonction aléatoire. Soit un espace métrique 
séparable complet (ou espace polonais) muni d’une mesure m(dx)o-finie 
et soit m(Ü) < co. 

Définition 3. On appelle intégrale de Lebesgue d’une fonction aléatoire 
mesurable {(x), x € ©} l'expression 


LEGO mx) — Lim. [EE GX) mx), (1.3) 
HA dant 7 


ou &,(x) cst une suite monotone non décroissante de fonctions aléatoires 
prenant un nombre fini de valeurs et telles que &(x) = lim &,(x) presque 


sûrement. 
Remarque. L'intégrale de Lebesgue (1.3) peut également être définie 
comme la limite (en m.q.) des sommes intégrales de Lebesgue 


f EG) md x) = Lim. D (xD mix), (1.4) 
tn n—-> 0 : 1 
où 
@ = S Lui, xx Eds. 
Théorème 4, Si l'intégrale 


J B(X, x) nd x) = ({) 
(ü 


est finie et n{Ü)<, alors l'intégrale de Lebesgue (1.3) de la fonction 
aléatoire mesurable {C(x), x €} est presque sûrement finie et peut être 
déterminée soit à l'aide de l'expression (1.4) soit pour chaque réalisation 


E(x). En outre 
E (| LE LE m(dx) — (| B(x, X) nd x). 
tÜ ) 


UD 
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Corollaire. Soient /,(x), 5 =.1, 2, des fonctions de £,(:b, X, m). 
Si la condition (1.5) est remplie, les intégrales 


m= [ARE MAX), = 1,2, 
4 A 


existent presque sûrement et 
E 71 fa — (| Î 0) BC, ») Je O)m(d x) n(d y). 
CUT 


Remarque. L'intégrale impropre (en m.q.) se définit comme suit : 
ESS | 


Ÿ CG) di = Lim. [ G) de. (1.6) 
W-r>, 


Pour que l'intégrale impropre (1.6) existe, il faut et il suffit qu'existe 


N M 
, En J B(+, s) dt ds. 


10.1.6. Développement en séries orthogonales. Soit {£(x), x € [a, b]} une 
fonction aléatoire hilbertienne continue de covariance B(x, y). La théorie 
des équations intégrales dit que le noyau Z{(x, y) peut ètre décomposé en 
une série uniformément convergente de ses fonctions propres ,(x) : 


B(X, ») = DER AOC (1.7) 
où 
ô b 


pa) = [ 8x, 7.0) dy, [raQ)pa(X) 4x = bus (18) 


les valeurs propres À, étant positives. 


Posons 
d 

= [ep G) dx. (1.9) 

On a alors (voir corollaire du théorème 4) 

b » 
EE = [ [ BG, ne, Q)p.0) dx dy = bn (1.10) 
ct 
8 

EG(x)i, = (| B(x, »)7,07) dy : 2,4, (x). (1.11) 


Donc, la suite de variables aléatoires &,, n == 1, est orthogonale. 
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Théorème 5. Toute fonction aléatoire hilbertienne E(x) mesurable et 
continue (en m.q.) sur un intervalle [a, b] se représente par la série 


œ 


GG) = >: En Ta(x), (1.12) 


qui converge sur L, pour chaque x € [a, b]. 

Dans ce développement EL, n= 1} cst une suite orthogonale de 
variables aléatoires telle que E1£, F= À, 4, Sont les valeurs propres, 
ps (x) les fonctions propres de la covariance B(X, y) de la fonction aléatoire 


tee Si une fonction aléatoire &(x) admet une loi de Gauss 
pour tout x, les variables aléatoires &, de la série (1.12) sont des variables 
gaussiennes indépendantes et cette série converge presque sûrement. 

Exemple. Le processus du mouvement brownien & (#) sur [0, 1] avec 
&(0) = 0, EË(r) = 0, Var&()=1et B(r, s) = EË (1)6(s) = min (r, 5) se 
représente par la série orthogonale 


. | 
ds sin (14) nt 
tu)= vi LS ne | 
s<0 


(n+ 5) er d 
où &, est une suite de variables aléatoires gaussiennes indépendantes de 
paramètres Eë, = 0, Var &, = 1. 


10.2. Mesures et intégrales stochastiques 


10.2.1. Définition d'une intégrale stochastique. Soient (9, &, P) un espace 
probabilisé, E un ensemble, MN un semi-anneau de parties de E. 

On appelle mesure stochastique orthogonale élémentaire une famille 
de variables aléatoires hilbertiennes {4 (4), 4 € D} vérifiant les conditions 
suivantes 

D) (A, U 4,) = 6(4,)+6(42) (mod P), si AiN4d3 = 

2 E& (4,)£ (cs) = = Mm(4,N4;), où m(4i) est une etion lenscoble sur 


3) ((S) = 0, ma) = 0. 

La fonction »1(4) est la fonction structurelle de © (/1). 

L'orthogonalité de la mesure stochastique &(4) résulte de la propriété 
2) : Et(4,)8 (43) = 0, si 4,14, = G. 

La fonction structurelle »(4) est une mesure élémentaire sur le semi- 
anneau Ÿ}, car elle est positive : »(4) = E|0(4) |° > 0, »m SG) = 0, et addi- 
tive : m(A,U 4) = n(4,)+m(dà) si ANA = ©. 


On appelle intégrale stochastique d’une fonction f(x) = 2 4 n %) 
1 
A,€M, définie sur E, par rapport à la mesure stochastique &(4) 
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l'expression 
Li] 
[CE GAx = À et(. (2.1) 
[TS 
Si l’on admet que la mesure élémentaire »(4) est semi-additive, on 


peut la prolonger en une mesure complète m1 sur la plus petite tribu £ con- 


tenant D. 
Soit L,(E, £, m) espace hilbertien de fonctions, muni du produit 


scalaire … 
U,8)= [ SG)eG)m x). 


Définition. On appelle intégrale stochastique de f(x) € L,(E, ©, m) 
par rapport à la mesure stochastique & (/f) l'expression 


[GE GX) = Lim. [ AGE), (2.2) 
où /,(x) € L,(E, ©, m) est une suite de fonctions simples telles que 
LIGA Em) +0, nc. (2.3) 


Théorème 1. La relation (2.2) est vraie pour toute suite de fonctions 
f(x) € L,(E, L, m) vérifiant la condition (2.3). Pour toutes fonctions f(x) 
et g(x) de L,(E, L, m), on a 


La f() +8 CIE GA) = à [SE GX)+B [e()E (x), (24) 
où «, B sont des constantes arbitraires ; 
E [GE Ga) J 8) x) = [SE G) mx). (2.5) 


Remarque. L'égalité (2.5) établit une relation isométrique entre 
L,(E, 2,m) et L,(@), espace hilbertien des variables aléatoires 7 — 


m [ZX (x), où SX) € La(E, {, ni). 

La relation isométrique entre L,(E, ©, m1) et 2,(€) peut servir de base 
à la définition d’une intégrale stochastique. 

Soit L, la classe des ensembles À € Î tels que »1(4) < , La fonction 
aléatoire d'ensemble 


(A) = [E7 (NE (dx) = (| &(dx) (2.6) 
A 


est une mesure orthogonale stochastique sur L,, vérifiant les conditions 
suivantes : 


DE(0 4) - É Eu s Ü 4er 
et AN4,= 9, sik#r; 

b) EË(4)ËÈ(B)=m(ANB), A,B€Lo; 

c)É(A)=E(A), AEM. 
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Théorème 2, Si une fonction structurelle m(A) d'une mesure stochastique 
élémentaire & (4) est semi-additive, alors {6 (4), À € D} peut être prolongée en 


une mesure stochastique {€ (4), À € Lo} et de plus 
f/OEGQx) = [ FU) ÈGx). (2.7) 


10.2.2. Propriétés d’une intégrale stochastique. Soit $ une mesure stochas- 
tique orthogonale dont la fonction structurelle m1 est une mesure complète 
sur {E, £}. Pour g(x) € L,(m1) posons 


(4) = [1408 (dx), A ER. (2.8) 
1. À(A) est une mesure stochastique orthogonale sur {E, £} de fonction 
structurelle 
/(4) = (| 1g8(x) m(dx). (2.9) 
4 
2. Si f(x) € L,(), alors f(x)g(x) € L,(m) et 
ff A@x = [O8 (Q)t(Ax). (2.10) 

3. Si m(A) < ©, alors 

ce [ HE ça»). (2.11) 

8(x) , 


4, Soient T un intervalle fini ou infini de la droite réelle, B la tribu des 
boréliens de 7, / la mesure de Lebesgue de T. 
Théorème 3. L'intégrale stochastique 


EG) = [et x)E (dx) (2.12) 


de la fonction borélienne g{r, x) € L,.(/Xm) peut être déterminée pour chaque 
tET comme une fonction de t de telle sorte que le processus E(t) soit 
mesurable. 
5. Si g(#, s) et A(:) sont des fonctions boréliennes telles que 
d 


à S 
(| I] Les, s)l? dém(ds) < ©, [IRAQ de (2.13) 


alors 
b œ œ [2 
fau) [et sédsdr= [ Ets) [ hG)gG,s) dt. (2.14) 
Remarque. La relation (2.14) est vraie pour a = —-<, b=+, si 


existe l'intégrale impropre I] h(t)g(t, s) dt au sens de la convergence dans 


Lam). 
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6. Soit {£(1), 1 E(a, b[} un processus à accroissements orthogonaux : 


E (£(r,) — (1) (EG) — Ets) = 0 


pour tous f, < fe < 14 < 1, appartenant à [a, b{[, continu (en m.q.) à 
gauche : 
El Ë(t)-E(s) ° -> 0 pour str. 


Soit D! la classe de tous les semi-intervalles 1 = [r,,/4[, at, < ta & 
< b. Définissons une mesure stochastique 


Gas fa) = £G2)—È (4) (2.15) 
de fonction structurelle 
m((s,, 10)=EISG)-EG)i = FR) - Ft), (2.16) 
où 
FG)= EIËÈ(G)—£ (a). (2.17) 


La fonction F(r) est continue à gauche monotone croissante. Donc, la 
fonction structurelle (2.16) est prolongeable en une mesure complète sur 
[a, b[. Par suite, l'intégrale de Stieltjes stochastique par rapport au processus 
à accroissements indépendants &(r) est définie par 


b b 


fr) dEQ)= | JU)ÈG) (2.18) 


pour une fonction borélienne arbitraire /(1)€ L,(#°). La définition de 
l'intégrale (2.18) subsiste pour b = + co. 


10.2.3. Intégrale stochastique par rapport à une mesure vectorielle. L'inté- 
grale stochastique se généralise aux mesures stochastiques vectorielles, 
Soit 6(-D = {1(1), 6°(4), ..., £P(:1)} une mesure stochastique vectorielle 
(orthogonale) sur M, de matrice structurelle »1(:1) = {mÿ(:1)} = 


= EG (4)8° (4) Gi (1) = ELEC), 1 <j, k < p) vérifiant les conditions 
suivantes : 


D éGU4) = 6 (4:)+6(4,) (mod P), si A, N.l = S ; 
2) Et (A4) 84) = mind): ch UE 1e, j<p: 
D ElECDI?= EtCHDTC DE È LEÉCII < 00, (3) — 0. 


p 


Posons »1,(4) = Tr m(4) = 2 ni (41). 
=] 


Si la trace m1, (1) de la matrice »1(:1) est une fonction semi-additive sur 
M, alors les nf (:1) peuvent être prolongées en des fonctions d'ensemble 
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o-additives sur {E, L}. La mesure matricielle complète (21) sur {E, L} est 
définie positive : 


» #m(nda = E >0 (2.19) 
J, kml 


> LA) 2, 


pour tous vecteurs z, = {2}, z$, ..., z?}et tous 4€, 1<k< p. 
&*(A) est un vecteur ligne de coordonnées &/(4), j = 1, 2,..., p. 


Considérons l'espace .£,{®?} des fonctions simples f(x) — D CA 
ks 


4, € D, muni du produit scalaire 
Ge)= [SEC mx). 
Définissons par ailleurs l’espace .22() des vecteurs aléatoires 


n= ÿ c6(d), 4€ M, muni du produit scalaire (7, 72) = Em: 2. 
&=1 


Désignons par ££(£) l’adhérence (au sens de la convergence en m.q.) 
g À des variables aléatoires -L8{0} et par -L,(m) la complétion de 
{m}). 
L'égalité 


n= f/HIGA» = D ct (4) (2.20) 


pour f(x) = ÿ x 40) établit une relation isométrique 7 = %(/) de 
Em] 


L,(m) sur LZ(€) qui peut être prolongée en une relation isométrique 7 = 
= %() de L,(m) sur L£(E). Le vecteur aléatoire 7 = % (/) est appelé 
intégrale stochastique et noté 


n= f/@EGx), f(x) EL). (2.21) 


Les propriétés de l'intégrale stochastique mentionnées ci-dessus subsis- 
tent dans ce cas aussi. 


10.2.4. Représentation intégrale des fonctions aléatoires. Les fonctions 
aléatoires peuvent être représentées par des intégrales stochastiques. 

Théorème. Soit donnée une fonction aléatoire vectorielle p-dimensionnelle 
{£(x), x €} de matrice des covariances B(x;, x3) = EË(x;)£* (xs) = 
= {B}(x1, xa)}, Bjr, xe) = EË(x) Ex), 1 <J, k<p, admettant la 
représentation intégrale 


B(x,, Xe) = | Lg(X1 U)g(Xe, 0) m(du), (2.22) 
dans laquelle m(A) est une mesure matricielle définie positive sur (4, 3) telle 
que mu) = Tr mu), g(x, u) une fonction scalaire vérifiant les conditions : 


1) gx, u) € L,(U, B, m.) pour chaque x E À ; 2) la famille de fonctions 
{g(x, u), x € 71 est complète dans L,, (A, B, mo). 
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Il existe alors une mesure vectorielle orthogonale stochastique {È(B), 
B € B} de fonction matricielle structurelle m(B) = EC(B)$*(B) telle que la 
fonction aléatoire {Ë(x), x € 0} soit presque stirement représentable pour 
chaque x sous la forme 


EG) = [ex 0) (du). (2.23) 


Ceci étant, la mesure stochastique {È(B), B € NW} est subordomée à la 
Ron aléatoire {E(x), x ET} en ce sens que Ê(R) € LE(Ë) pour chaque 
B € #. 

La mesure stochastique {C (8), B € B} se définit à l'aide de la relation 
isométrique entre 2,(£) et 2,(£), relation qui est telle que 

a) É(x) + gx, u), É(B) — 7e) ; 

b) si 7, <> fi(u) (= 1, 2), alors 


M =: Î fi) È (du) ;  Enini —: (| OPA m(du). 


10.3. Prédiction linéaire ct filtration 
des fonctions aléatoires hilbertiennes 


Une fonction aléatoire hilbertienne {£ (x), x €} à valeurs dans un espace 
mesurable (£E, {) engendre un espace hilbertien de variables aléatoires 
L:(E (x), x ED), enveloppe linéaire fermée (au sens de la convergence en 
m.q.) de la famille de variables aléatoires {£(v), x Ed} et de la famille des 
constantes. 

L'espace hilbertien -2,(£(x), x € :Ü) est un sous-espace de l'espace hil- 
bertien L,(92, S, P) de toutes les variables aléatoires hilberticnnes définies 
sur le même espace probabilisé (9, S, P) que la famille des variables aléatoi- 
res hilbertiennes {£ (x), x € ‘Ü}. 

La meilleure approximation linéaire (ou estimation) Ë d'une variable 
aléatoire hilberticnne & € L,{9, S, P} dans l'espace L,(£(x), x €) est 
définie par la condition : 


Eÿ-£{S<EIé-6 pourtout 2€ L,{E(x), x EÜ}. (3.1) 


La condition (3.1) dit que l'estimation Ë présente une erreur quadra- 
tique moyenne minimale. 


De la théorie des espaces hilbertiens il résulte que l'élément Ë est la 
projection de à sur le sous-espace L,{£ (x), x ED} et est définie de façon 
unique (mod P) par le système d'équations linéaires 


ECé(N) = ELE(), x ES. (3.2) 


L'erreur quadratique moyenne 0 de l'égalité approchée Ëæ cest égale 
à la longueur de la perpendiculaire abaissée de l'extrémité du vecteur & sur 
le sous-espace L.(£(), x €) et est donnée par la formule 


= E|E--c [2 (3.3) 
15% 227 


En particulier cest remplie la condition d’absence de biais : 
EC = Et. 


La meilleure estimation linéaire & définie par le système (3.2) est une 
fonction linéaire de £(x) de variance finie. L 

Le problème de la construction de l'estimation & se pose dans le lissage 
(extrapolation) d’un processus aléatoire {£ (),1€ T},c'est-à-dire l'estimation 
de la valeur £(r*) sur le vu des réalisations de &(1) aux instants s € T anté- 
rieurs à 1°. : 

Un autre exemple de construction de l'estimation & est le problème 
de filtration linéaire d’un processus aléatoire qui consiste en ce qui suit. 
On observe un processus £(1) = &(t)+(r), somme d'un signal utile € (1) et 
d'un bruit (7). On demande de séparer le signal du bruit, c'est-à-dire de 
trouver pour un #* donné les meilleures approximations linéaires 
LE L,(Ë(), 1 ET) pour le signal £ (1°). » 

Il est clair que l’approximation linéaire & n'est pas toujours acceptable 
sur le plan pratique. Cependant, dans le cas très important, où toutes les 
lois finidimensionnelles des variables aléatoires {£(x), x € D} sont normales 
et Eë(x) = 0, EC = 0, la meilleure approximation linéaire dans £L,(£(x), 
x €‘) est également la meilleure en m.q. 


Dans ce cas 
ê = Efé/a(é(x), x € ©)], (3.4) 
où a(Ë(x)), x € Ü) est la tribu engendrée par l'ensemble des variables aléa- 
toires {£(x), x ED}. 
Exemple 1. Soit donné un ensemble fini de variables aléatoires 
hilbertiennes linéairement indépendantes {£,, & = 1,2, ...,n}. La solution 
du système d'équations linéaires (3.2) est donnée par 


(Es En). En) 
= | AN PS 
(4 7 » (3.5) 
DIE)... EEE 
@, £,) CC (, &,) 0 


où l'=T(Ë,,£,,...,4,) est le déterminant de Gramm du système 
{E,, k=1,2,...,n}: 
(é,, £1) .… (£, En) 


Css node so. . (3.6) 
(é,, &1) …. (E, ë,) 


L'erreur quadratique moyenne à? = E |£—6 |* est définie par 


2 TÉnéssses0 
ds r'(ê,, ss 15900) . G.7 
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Excmple 2. Soit donné un processus aléatoire hilbertien continu 
{£(1), 2 E a, b]} sur un intervalle de temps fini de fonction de corrélation 


RG, 5) = E[(£G)-a())(E()-a(s))], at) = Et(). 
Le processus {£(r), 1 € [a, b]} est développable en série orthogonale 


QUE > ga), (3.8) 


dans laquelle RE £E = 20, : 2, et g,(4) sont les valeurs propres et les 
fonctions propres de la fonction de corrélation R(#, s) sur (a, b] : 
L 


FRE HF, 6) ds — 2,g,0). 


Dans ce cas la meilleure estimation linéaire & est définie par les expres- 
Sions : 


VV » 
E— D, Cu = | P.U)È() dt ; (3.9) 
CEA es 
è 
RE ee [ Re) Ge) di (3.10) 


où 
Reë(s) = ECË(r). 


L'erreur quadratique moyenne de l'estimation est donnée par 
M=EItR- Sie. G.11) 
CRE 


On ne peut se servir de ces formules que si l’on connaît les valeurs et 
fonctions propres du noyau R(4, s). 


Chapitre 11 
PROCESSUS STATIONNAIRES 


Les processus dont telles ou telles caractéristiques sont invariantes par une 
translation du temps ou du paramètre spatial, ou, d'une façon plus générale, 
les processus dont certaines caractéristiques sont invariantes par un groupe 
ou un semi-groupe de transformations, occupent unc place importante en 
théorie des processus aléatoires. 

De tels processus possèdent certaines propriétés d’invariance, de station- 
narité. Les caractéristiques invariantes par un groupe ou un semi-groupe 
donné de transformations sont le plus souvent les moments ou les lois fini- 
dimensionnelles. 

Dans le premier cas il est question d’une stationnarité d'ordre r, si 
sont invariants tous les moments jusqu'à l'ordre r inclus. La plus importan- 
tu classe est celle des processus stationnaires d'ordre deux appelés généra- 
lement stationnaires au sens large. 

Si pour caractéristiques invariantes on prend les lois finidimension- 
nelles, on a affaire à une stationnarité au sens strict et les processus corres- 
pondants sont dits statiannaires au sens strict, 


11.1. Processus aléatoires stutionnuires 
au sens large 


11.1.1. Définitions fondamentales. Soit ({, ©, P) un espace probabilisé 
donné sur lequel on considère des processus aléatoires {5(1), € T}, où T 
est un ensemble de la forme ]-<:, &1[,[0, «:{ (7 continu) ou {0, +1, 
+2, ...}, (0, 1, 2, ...} (1 discret). 

£(s) peut prendre ses valeurs soit dans À! - ]— >, [ (processus sca- 
laire récl), soit dans le plan complexe Z (processus scalaire complexe), 
soit dans un espace euclidien AR? (processus réel de dimension £), soit dans 
un espace complexe Z# de dimension 4 (processus complexe de dimension 4). 

Définition 1. a) Si {£(), € T'}est un processus scalaire et si existe E | #(s )|* 
pour s € T, alors la fonction C(4, 1) — EË(1)$(s) est dite fonction de covarlan- 
ce et la fonction B(4, s) = E[ë(s) -E£(1)] [£ G)—EEË(t )] fonction de corréla- 
tion du processus {£(1), 1€ T). 

b) Si Et) = (£,(), EG), ..., )), € T'est un processus vectoriel tel 
qu'existent EE (EG), dm 1,...,k, alors la matrice C4, s) — 


= (e,,0,9), om 1,44, où 0, 8) = EË() £,(s) s'appelle matrices 
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des covariances ct la matrice Z2(4,5) — {2,,(4, 5), /,m — 1,...,Kk4, où 
Bin 5) = EfhG)-EË()1(E(G)—-ES,(4)], matrice de corrélation du 
processus {Ë (1), 1€ T}. La matrice des covariances C(1, s) peut être mise 


sous la forme 
CG, s)=ES(t)E*(s), (1.1) 


où le symbole * désigne le transposé conjugué du vecteur colonne £(s). 


Dans le cas scalaire il est plus commode d'admettre que &*(s) = £(s), 
donc la formule (1.1) peut ètre utilisée aussi bien dans le cas scalaire que 
dans le cas vectoriel. Les fonctions C(#, s) et B(t,s) sont appelées 
respectivement fonction de covarinance et fonction de corrélation dans les 
cas scalaire et vectoriel. 

Définition 2, Un processus aléatoire {£(r), 1 € T} est dit stationnaire au 
sens large si son espérance mathématique EË(r) = a ne dépend pas def et sa 
fonction de corrélation B(r, s) ne dépend que de la différence (1 —s), c'est-à- 


dire si 
Bt, s) = B(t-s). (1.2) 


Donc, si {£(1), CT} est un processus stationnaire au sens large, le 
processus {5,(1),1 € T}, où &,(1) = É(t-tu)et u € Test fixe, possède la même 
espérance mathématique et la mème fonction de corrélation B(+) — B(1, 0) 
que (sr). 

La variance du processus stationnaire au sens large est confondue avec 
B(0) : E[£()-a](£(4)- a] = B(0). 

Les fonctions de corrélation et de covariance sont liées par la relation 


C5) BU 5) t'au*, 


done C4, 5) - C(1-— 1) pour les processus stationnaires,. 
Si EË(1) - 0, les fonctions de covariance et de corrélation sont con- 
fondues. Bien plus, si C(4) -— C(, 0), la formule 


C4) = A) tauau° 


montre que, sans restreindre la généralité, on peut considérer un processus 
d'espérance mathématique nulle, car on peut toujours passer à un processus 
&,(4) = £()—E Ë(0) jouissant de cette propriété. 

Tous les processus à temps continu étudiés dans ce chapitre sont suppo- 

sés continus à droite en m.q., c'est-à-dire 
lin EIIË(S) -IG)IF — 0, 1ET. 
st 

Soient {£(1), 1€ T} et {n(r), 1 € T} des processus stationnaires au sens 
large, de fonctions de corrélation Be(1) et B,(+) respectivement. 

Définition 3. On dit que les processus {2(4), 1 € T}et {n(r), 1 ET} sont 
Stationnairement liés si leur fonction de corrélation mutuelle /?:,(1) - 
-: ES) n° (5) ne dépend que de la différence (1-5). Pour cette raison les 
fonctions /:(1) et B,(1) sont parfois appelées fonctions d'autocorrélation. 
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La fonction de corrélation Z2(1) d'un processus stationnaire jouit des 
suivantes : 
1. Hermiticité : 


H-1 ocessus scalaire), 
B() = (—#) (pr aire) (1.3) 
B*(-7#r) (processus vectoriel). 
2. Définition non négative : 
Al 
SO RG-1)24,7 0 (processus scalaire), (1.4) 


en = À 


quels que soient N > 1,16€ T, et les nombres complexes 2,,/ = 1, ...,N; 


A 
YO #R(-1,)2,=0 (processus vectoriel), (1.4’) 


quels que soient >= 1, 1, € T, ct les vecteurs z, ; / = 1,...,N. 
3.1 R(1)| = B(0O) (processus scalaire), 


BU) <= R,(0) B.(0), /, m = 1, ..., K (processus vectoriel). 


4. Si (le temps étant continu) la fonction de corrélation Æ(r) est con- 
tinue au point # — 0, elle le sera en tout autre point € T. 
S. Si (1) = (£,(4), ...,8,()) est un processus vectoriel, les fonctions 


on m0 
FT V/ByO) 8,0) 


qui sont dites coefficients de corrélation mutuelle des composantes ë,(1) et 
Et) vérifient l'inégalité 


—1<p,G)=t, m=1,...,k 


et définissent le degré de dépendance linéaire des processus &,(#) et £,(+). 

Divers processus stationnaires peuvent avoir les mêmes cspérance 
mathématique et fonction de covariance. 

On appelle processus gaussien stationnaire (ou processus normal 
stationnaire) un processus stationnaire {£ (+), s € T'} tel que pour tout n => 1 
et toute collection {€ 7, k = 1, ...,n} le vecteur (Ë(r,), £(r2), ..., £(r,)) 
admette une loi normale multidimensionnelle. 

Tout processus gaussien stationnaire cest défini par son espérance 
mathématique et sa fonction de covariance. 

Inversement, toute fonction »1(1) = const et toute fonction A(r) possé- 
dant les propriétés (1.3) et (1.4) définissent un processus gaussien station- 
nairce. 


A 
Soit ECM) — D 2,8(4,), où N > 1 est un entier quelconque 4, € T, , 
=i 


des nombres arbitraires. L'envelopne linéaire H,{£} de toutes les variables 
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aléatoires &*? construites avec le processus {£(4), € T'} est un sous-espace 
de l'espace hilbertien 2,(9, G, P) des fonctions €-mesurables sur 9 de 
carré intégrable par rapport à la mesure P. Munissons //,{£} du produit 
scalaire 


Efñf (processus scalaire), 
(&, »-| DE (1.5) 


Tr Eën* (processus vectoriel), 


où Tr B est la trace de la matrice B, c'est-à-dire la somme de ses éléments 
diagonaux. On appelle espace des valeurs du processus {£ (1), 1 € T} l'espace 
hilbertien H:, adhérence de #,{£} pour la norme engendrée par le produit 
scalaire (1.5). Le processus {£(r), # € T} s'interprète géometriquement com- 
me unc courbe de l'espace L.(9, S, P) ct F/: comme l'intersection dc tous 
les sous-espaces de L.(9, G, P) contenant cette courbe. 


111.2. Exemples, 1. Soit &., #1 1,...,p, une collection de variables 
aléatoires non corrélées telles que 


EC, = 0, EL à, — à, 10 
où Ô,, est le symbole de Kronccker, 4 <co, Si p =, admecttons que 


ÿ 02 < © ct soit À, m1= 1, ..., p, un ensemble de réels. 


np 
Le processus {£(1), 1€ 77, où £ (4) — > ent CSt UN Processus 
mi 


p 
stationnaire au sens large, puisque ES (1) = Oct Z(r, 5) = > cn 0 8 
CES! 


— B(t—Ss). 

2. Soit &,, m1— 1, ..., p, un ensemble de vecteurs aléatoires non 
corrélés de dimension A tels que EË, = 0, EG, Cr = 16, où G, cst 
une À X£k-matrice hermiticnne définie non négative, et soit 2, Mm=1,...,p 
un CAEN de réels arbitraires. Le processus {£(1), 1 € T}, où E() = 


_ ) entité. est stationnaire au sens large, puisque EË(r) = 0, B(t, 5) — 


Je Ÿe À min G, = H(t—-Ss). 
ml 
3. Supposons que Ë(1) = cos (47 +p), où y est une variable aléatoire 
uniformément répartie sur [0, 21{, et la variable aléatoire 7 ne dépend pas 
de et admet G(x) pour fonction de répartition. Le processus {£(1), 1 € T} 
est un processus stationnaire (réel) au sens large, puisque 


Et) = 0, B(r, = + Ï cos [(—s)x]G(4x) = BU). 


— 00 


233 


4. Soient T°: [0, [ct {w(4), 1€ T'} un processus wienérien station- 
naire. Le processus {£(r), 1 € T}, où £() : we +) w(r) et A =- 0 est un 
nombre fixé, est un processus stationnaire (récl) au sens large, puisque 
Ef(s)=0 ct 


"0 si lt-s|>4 


B(t,5) = | = B(t—Ss). 


h—|t-st si [1-s)<h 


* 5. Soient T = {0, +1, +2, ...} et Ê(1), 1 CT, unc suite standard de 
variables aléatoires non corrélées, c'est-à-dire E5(1) :: 0, EËGn)Ë(1) - on ; 


c(t), 1 ET, une suite de nombres complexes telle que lc) < ©. 
ter 
La suite aléatoire {Ë (1), € T}, où £(4) -- >, c(t—s)Ü(s) cest unc suite 
sC 


stationnaire au sens large, puisque E Ë(r) :- 0, 
Bt, s) -- » c(t—s 1m) cn) -- Bt»). 


mer 


6. Soient T°: ]—-co, of et {0(1), 1 CT} un processus standard de 
dimension 4 à accroissements orthogonaux, c'est-à-dire E&(1) = 0, 
E(6()—-6(4:)]l(s)-6(s2)] =0 pour 1s<ti<s;<s,, Ef[8(t)- 
—6(9]EG)-ÈCSI = 11-51 7, où 7 est la ÆXA-matrice unité, C(r), 
ET, unc fonction matricielle telle que Tr f CCC) dt <es, 

Le processus {£(1), 1 € T}, où £(r) = (| C(t—s) dé(s) ct l'intégrale 


cst comprise comme la limite en m.q., est un processus stationnaire au 
eœ 
sens large, puisque E Ë (4) :: 0, Z(4, 5) -: J CG-stu)C*(u) du = R(t--s). 


Lcs processus des exemples 5 et 6 sont dits à sommation glissante 
ou autorégressifs. 


11.2. Représentation spectrale des fonctions 
de corrélation 


11.2.1. Théorème de Bochner-Khintchine. Soir {£(1), 1 € T'} un processus 
stationnaire au sens large de fonction de corrélation B(t). 
a) Si {Ë(), 1€ T} est un processus scalaire à temps discret, alors 


BG)= [et dF(2)= [cos AdC(A)i sin Ad4Q() (2.1) 
7 0 
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où F(à) est une fonction croissante positive définie de façon unique pur B() 
sous réserve que F(— 1) = 0 et F() soit continue à droite ; C(2) une fonction 
paire réelle à variation bornée telle que C(2)-C(9:=0 pour }, z= 2, : 
Q(A) une fonction impaire réelle à variation burnée. 

b) Si{£(),1€ T} est un processus vectoriel à temps discret, alors B(t) 
est justiciable des représentations (2.1), où F(4) est une matrice dont les 
accroissements F(À,)—F(22), /,:= }., sont hermitiens et définis positifs ; 
C(2) une matrice symétrique réelle dont les accroissements C(2,)—C(22), 
À,= 22, sont définis positifs : Q(à) une matrice symétrique gauclie réelle. 
F(À) est définie de façon unique par B(t), si l'on exige que F(- x) = 0 (la 
matrice nulle) et F(à) soit continue à droite (au sens de la convergence des 
éléments ). 

c) Si {Ë(), 1 € TE est un processus scalaire à temps continu, alors 


B() — Î el dF() Ï {cos 114 C(2) : sin 12dQ(2)], (2.2) 
1 0 


où les fonctions F(À), C(À) et OO) sont définies comme dans à) hormis la 
condition : F(— <>) ::0 

d) Si {ë(4), 1€ T} est un processus vectoriel à temps continu, alors B(t) 
admet les représentations (2.2), où les matrices F(2), C(2) et Q (À) sont définies 
os dans b) à l'exclusion de la condition : F(-— o>) 7: 0 (la matrice 
nulle ). 

La fonction F(À) est appelée fonction spectrale (matricielle) du processus 
(5 (),1€T}ct la mesure engendrée par la fonction spectrale F(2), mesure 
spectrale. 

On a les relations suivantes : 


Fm) (temps discret), 
B(O) — | (2.3) 
F(æ) (temps continu), 


ICQ) df(à), 2-0, (2.4) 
T7 2 RedF GO), À # 0, 


0, À ea 0, 


(2.5 
21m d4F (4), À 0. ee) 


so | 


11.2.2. Exemples. 1. Soient T = ]—c, «cf, E(r) = ne", où les variables 
aléatoires » et £ sont indépendantes, Er = 0, Var 7 = ui ct la variable 
aléatoire £ admet une fonction de répartition Ge(x). Le processus stationnai- 


re {Ë(), 1€ T} a pour fonction de corrélation Be(r) =  [ e"*o3Ge(dà), 


donc la fonction spectrale Fe (4) = 0%Ge (À). 
235 


Cet exemple montre qu'il existe des processus stationnaires admettant 
une fonction spectrale Lane donnée à priori. 
2. Soient T = {0, +1, +2, ...} ct {È (4), 1€ T} une suite de variables 


alatoires non corrélées Le que EË(r) = 0, EË(r)Ë(s) = Ô,u*. Sous ces 
conditions 


par suite, F(4) — ue 0. 
at 
3. Soient T = [0, 1{ et {È(), 1 € T'} un processus stationnaire au sens 
large ct markovien au sens large. Être markovien au sens large signifie que 
a(s, 0) — a(s,t)a(t,u),s < 1 < un, où 


EË()E(S)  . 2, 
= Sie(s)l :- 0 ; 
ats,0) = L'EIEG)E si ÉEiS(s)| 
1) si  EIË()E = 
La fonction de corrélation (1) est de la forme 
BG)=e”2't'et, «=>0, oubien B(1) = el 


(est un réel). 
Dans le premier cas, la SES spectrale 


à 


F() = — — arclg 


Dans Île second cas, 


ou, Àz=H/}; 
F(Q) = 
(9) k d < fi. 


11.2.3, Densité spectrale, Si | dm dF(Q) <=, où.l = [-7,7]sit est discret 
ct À= )}-, œf si 1 est nina, alors S, - "4 àr dF(À) cest appeléc 


moment spectral d'ordre m. 
Théorème. Unie condition nécessaire et suffisante pour que [ 22% dF(2) < 
x 
< © est que la fonction de corrélation B(t) admette une dérivée d'ordre 
2men 0. 
La fonction spectrale F(À) est justiciable de la décomposition de 
Lebesguc 


FQ) = F0) +F:0) + F3Q). (2.6) 
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F,() est absolument continue par rapport à la mesure de Lebesgue, 
c'est-à-dire 
À 
Î fU@)dÀ (temps discret) ; 
—1 
A 
f SU)d? (temps continu). 


© 


F,) = (2.7) 


Fa) ne peut varier que par sauts sur un ensemble fini ou dénombrable de 
points 4. F.(2) est continue et admet une dérivée presque partout nulle par 
rapport à la mesure de Lebesgue. La dérivée F/(2) = f (2) de la composante 
absolument continue de la fonction spectrale F(À) s'appelle densité spectrale 
(matricielle). 

Si {£(r), 1€ T} est un processus vectoriel de fonction spectrale F(/) 
absolument continue et si sa densité spectrale matricielle f (2) — F’(2) est de 
rang r,r = 1,...,k, où k est la dimension du processus, alors {£(r), 1 € T} 
est dit processus de rang r. Si r = k, c'est-à-dire det / (2) # 0 pour presque 
tous les 2, alors {£(r), t € T } s'appelle processus de rang maximal. 


11.3. Représentation spectrale des processus 
stationnaires 


11.3.1. Représentation spectrale. Aux représentations spectrales (2.1) et 
(2.2) de la fonction de corrélation B(t) sont associées les représentations 
spectrales du processus {£(r), 1 € T'}. 

Théorème 1. Tout processus aléatoire stationnaire au sens large de 
fonction spectrale F() adniet la représentation 


£G&)= fedi() = [cos 1Adn ()+sin 1448), (3.1) 
A A 


où À = [-—17, 7] si le temps t est discret et À = ]—, co si t est continu, 
les intégrales sont comprises commie les limites en m.q. des suites de Riemann- 
Stieltjes, &(2), n(2), 0(2) sont des processus à accroissements orthogonaux 
tels que 
EC (4) = En(4) = E6(2)=0; 

Ed& (2) d£*(2) = dF()) ; 

Edn(2)dn° (à) = dC(2) ; 
dQ(à), À=0; 
dC(, #0; 

Edn() db* (2) = —-E d0(À)dn*(2) = dQ()). 
Si l'on exige que le processus &(À) soit continu à droite en m.q., alors il est 
défini de façon unique à des sous-ensembles de {2 de probabilité nulle. 
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E d0(2) d0* (2) = 


Dans la forme (3.1), le processus ©(4), s'appelle processus spectral 
associé au processus stationnaire {i(41),1 € T}. | 
Soit l'un borélien de.f. Posons D(7") -- [ dit). La fonction aléatoire 
l' 
d'ensemble (1") possède les propriétés suivantes : 
1) P(')+807)- DUT si ils = 5; 


2) EP(T)P*(T)= | dF() ; 
r 
3) ED DB D=0 si lNlse: : 


si l'={J1, in, - 59, 


alors D(1") = y (1°) est la série de droite converge en m.q. (:-) cest 
lœi 


appelée mesurc spectrale. 


Les propriétés de la mesure spectrale permettent de représenter un 
processus stationnaire sous la forme équivalente 


EG) fehdeQ)= [ep 
2 À 


Si {£(4), 1€ T} est un processus scalaire, l'élément ed (2) est une 
oscillation harmonique de vitesse angulaire À et dont l’amplitude aléatoire 
et la phase aléatoire sont définies par la variable aléatoire 


dé (A) = |dË()] efsre UE), 


La représentation spectrale indique de quelles oscillations harmoniques 
élémentaires cst constitué le processus & (+). 

Sous la forme (3.1) les processus spectraux & (À) sont subordonnés au 
processus {£(1), s € T} en ce sens que € He, où He est l'espace des valeurs 


du processus {£(r), r € T}, & est la limite en m.q. d'expressions de la forme 
# 


ÇA = 2 ax 0 (As). 


Soit {£(r), 1€ T} un processus scalaire de fonction spectrale F(À). 
Désignons par L,{F} l’espace hilbertien des fonctions (2) de carré inté- 
grable par rapport à la mesure engendrée par F(/), et sur lequel le produit 
scalaire est défini par 


@,y)= frG)yO)dF@), 
A 


ct l'intégration effectuée sur [—x, 7] ou sur ]—, cf. Dans L,{F} on 
identifie les fonctions y. (2) et y, (4) telles que 


AUTO AO) RO AO) LAOEN 
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Une conséquence immédiate de la représentation spectrale (3.1) est 
l'isomorphisme isométrique entre He et L.:{F}, puisque pour tout 7 € Hz il 
cxiste unc fonction unique (à l’équivalence précédente près) p(1) € 2,{F) 
telle que = f pU)dË(G), ct, inversement, si p(2)€ L,(F}, alors 


À 
f pU)dS (à) = n€ He. La correspondance 7 + p(À) est isométrique : si 
A .e su : | ’ 
L' [bas PO), i= 1,2, alors | | e- 
Gas 0) = Emi OP OEIMUGPE 
A 


PE] 


= fp1U)p21Q) 4F 0) = (Ps Pa): 
A 


Pour les processus vectoriels on définit de façon analogue l'espace 
hilbertien £L.{F} des mXk-matrices p(4) (m est quelconque, mais fixe, k 
cst la dimension du processus), muni du produit scalaire 


(y) = Tr LS p()dFQ)y* ©] 


et si »1 = k, alors Hg et L,{F} sont isométriquement isomorphes. 


11.3.2. Processus de fonction spectrale absolument continue. A la décomposi- 
tion de Lebesgue (2.6) de la fonction spectrale F(À) correspond la décompo- 
sition suivante du processus {£(r),1 € T} 


E() = En) +5 (O) +5 (6) (3.2) 


cn trois processus stationnaires deux à deux orthogonaux. 

Le processus &, (1) admet une fonction spectrale absolument continue 
F, (). Ces processus se caractérisent de la manière suivante. 

Théorème 2. Un processus aléatoire stationnaire au sens large {Ë(t), 
1ET} possède une fonction spectrale absolument continue si et seulement 
si c'est un processus autorégressif, c'est-à-dire il existe des fonctions (matri- 
ces) C(t) telles que : 

a) dans le cas d'un temps discret 


8@)= Ÿ CG), 63) 


où ÿ CG)? <co (pour un processus scalaire), ou Tr Ÿ C(t)C*X 


X(t) <co (pour un processus vectoriel) et ot) est une suite stationnaire 
standard à valeurs non corrélées ; à 
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b) dans le cas d'un temps continu 


£Q)= [ Ca-s)di(s), (3.4) 


CLS ®] 


Les [se 5) 

où f | Ce) dt < © (pour un processus scalaire ), ou Tr f C(t)C*°(t)dt < 
0 0 

<œ {pour un processus vectoriel) et &ç(t) est un processus standard à ac- 

croissements orthogonaux. 

Pour les processus vectoriels on peut indiquer une autre caractéristique 
qui tient compte du fait que la fonction spectrale / (2) est susceptible d’avoir 
des rangs différents pour divers /. 

Théorème 3. Pour qu'un processus stationnaire vectoriel {Ë(t), 1€ T} 
possède une fonction spectrale absolument continue, il faut et il suffit qu'il 
soit représentable par une somme d'au moins k (k est la dimension du pro- 
cessus) processus deux à deux orthogonaux autorégressifs 


t 


ëq) = > &Q@), (3.5) 


= 
où si t'est discret 


EG)= CUS), Tr D CU)CP()<, 
sET ‘ET 


C\{G) sont des kXl/-matrices, &,(s) des suites aléatoires stationnaires non 
corrélées et deux à deux non corrélées l-dimensionnelles, et si t est continu, 


£G)= [GG dus), Tr | GA)C() dt < ce, 


—- 


C\() sont des KXl-matrices, &,(s) des processus standards deux à deux 
orthogonaux à accroissements orthogonaux. 

En particulier, si le processus £ () possède unc densité spectrale absolu- 
ment continue et un rang constant 7, alors 5 (1) = &,(r), où &,(4) est l’un des 
processus décrits plus haut. 


11.4, Propriétés analytiques ct trajectuires 
des processus stationnaires 


11.4.1. Continuité ct dérivabilité en moyenne quadratique des processus 
stationnaires. Soient {£(1), 1€ T} un processus scalaire à temps continu, 
B(t)et F(À) respectivement sa fonction de corrélation et sa fonction spectra- 
le. La continuité ct la dérivabilité en moyenne quadratique des processus 
stationnaires, qui sont des cas particuliers des processus aléatoires hilber- 
tions, se définissent comme pour ces derniers. 
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Théorème 1, Pour qu'un processus {5(0), 1€ T'} soit continu en moyenne 
quadratique, il est nécessaire et sufisant que sa fonction de corrélation B(t) 
soit continue en 0. Pour qu'un processus {È(t), t € T} possède une dérivée en 
moyenne quadratique d'ordre m, il est nécessaire et suffisant qu'existe la 
dérivée m-ième de sa Jonction de corrélation B(t) en 0, ou, ce quiest équivalent, 
qu'eXiste le moment spectral 2m-ième 

C3 
Sen= f #"dF(). 


En particulier, si le processus scalaire réel {£ (+), t € T} possède un moment 
spectral d'ordre deux S, =  f 4*4F(2) fini, alors le processus #(1) = (£'(r), 
ë(r)), 1 ET, où &’(r) désigne la dérivée en moyenne quadratique en #, est 
stationnaire au sens large et sa fonction matricielle de corrélation B,(+) est 
de la forme 


f et 2 dF() fe à dF(?) 


B, (t) — de : : 
fe“idFQ) [ e4F() 


11.4.2. Propriétés analytiques des trajectoires. Les propriétés des trajectoires 
des processus stationnaires à temps continu se décrivent par les théorèmes 
suivants. 

Théorème 2. Si 

LA] 
2B(0)- B(t)— B(—1) tr) (4.1) 

pour t — 0 pour un q > 3, alors le processus {£(t), t € T} possédant une telle 
fonction de corrélation est équivalent à un processus dont les trajectoires sont 
Presque sûrement continues sur tout intervalle fini. La condition (4.1) est 
réalisée, en particulier, si B(t) possède une dérivée seconde en 0. 

Remarque. Pour les processus stationnaires gaussiens, la proposition du 
théorème 2 est réalisée si la condition (4.1) est remplacée par 


B(t) = 1-07) pour / —+ 0. 
Théorème 3. Si 
3 
6B(0)-4B(1)-4B(-1)+ B(24)+B(—21) = 0e) (4.2) 
| 


lorsque t 0 pour un q > 3, alors le processus {£(t), 1 € T} possédant une 
telle fonction de corrélation est équivalent à un processus dont les trajectoires 
sont presque sûrement continûment dérivables. La condition (4.2) est, en 
particulier, réalisée si B(t) possède une dérivée quatrième en 0. 
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Remarque. Pour les processits stationnaires gaussiens, le théorème 3 a' 
lieu si l'on remplace la condition (4.2) par 


À TA 
BG) 1-2 À rit): 


De façon analogue, l'existence des dérivées d'ordre supérieur des 
trajectoires des processus stationnaires cst liée au comportement de la 
fonction de corrélation en 0. . 

Théorème 4. Si Ja fonction spectrale-F Q) d'un processus stationnaire ne 
varie que sur un intervalle fini, ce processus admet un processus équivalent 
dont les trajectoires sont presque sûrement analytiques. 


11.5. Théorèmes crgodique ct limite central 


11.5.1. Théorème crgodique. Soient {£ (1), 1 € T'} un processus stationnaire 
au sens large, B(t) et F(), respectivement ses fonctions de corrélation et 
spectrale, ë(r) == Je M 4Ë (À) sa représentation spectrale. 


Les té 
s- 1 
. Y (0), T = {0, 1,2, ...}, s sont des entiers positifs ; 
4-0 


_ I 3 EU), T'=:{0,11,H+2,...},s sont des entiers positifs ; 
L 


$ 


vs — 
: J EG) dt, FT — (0, 1, s sont des nombres positifs ; 
” 0 
_ fic)d, l'::]-c, of, s sont des nombres positifs, 
sont appelées moyennes temporelles. 
Soient 
s -1 
| D BG, T=:{0,1,2, ...}; 
LU 
| # 
_— - t), T::40, F1, +2,...}); 
Dh, PU FAI } 
D, — 


1: À : 
_ j B(t)dt, T=[0, cl ; 


1 : , 
Cr (| B(t) dt, T = ]-, of. 
—, 
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L'existence des limites en moyenne quadratique des moyennes tem- 
porelles £, pour 5 constitue les théorèmes ergodiques ou la loi des 
grands nombres pour les processus stationnaires. 


Théorème 1. 
Lim £, = 6(0)-5(0-) ; 
lim 8,= F(0)-F(0-). 
Théorème 2. Pour que l.i.m £, = E4(t) = 0, il est nécessaire et suffisant 


4 —0 
que la fonction spectrale F(}) soit continue en 0. 
La condition lim B(r) = 0 est suffisante pour la continuité de F(À) en 0. 


t— 
Si B(t) tend assez vite vers O0 pour f co, les moyennes temporelles £, 
peuvent converger vers EË(r) = 0 non seulement en moyenne quadratique 
mais presque sûrement. 
me 3. Siexistent des constantes K = 0 et « = O telles que 


1 s—1 s-1 s—1 
2 À Bu) = _. nr Bu(r) É - 1 < Ks”® 


dans le cas de t discret et 
# . 0 
| Il Bd ddr 8) [1 à Ks=a 
FE Î mr u) du =— | di nn. < ÀS 
0 0 —. 


dans le cas de t continu, alors 6, converge presque sûrement vers EË(t) = 0. 
Remarque. Le théorème 3 est formulé pour un processus vectoriel. 
Pour un processus scalaire, il faut remplacer B,,(t) par B(t). 
La condition 
. BG) =yl1t17, 
où ycest une constante positive, est suffisante pour la réalisation des con- 
ditions du théorème 3. 


11.5.2. Théorème limite central. Si un processus {£(1), / € T'} possède une 
fonction spectrale F(2) absolument continue et une densité spectrale / (4) 


continue en 0, alors 
lim sEË,Ë* = 2x/f(0). 


8 


Théorème 4. (Théorème limite central pour processus stationnaires). 
Si un processus vectoriel {Ë(t), 1€ T} possède une fonction spectrale F() 
absolument continue et une densité spectrale f (À) continue en 0, et, de plus, 


k 
Tr/f (À) = x {5 Q) (K est la dimension du processus) est uniformément 


bornée et det f(0) # 0, alors les vecteurs VS£, sont asymptotiquement 
normaux de moyenne nulle et de matrice des covariances 21 f(0). 
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11.6. Transformations linéaires (filtres) 


11.6.1. Définition d’un filtre linéaire. Soient {£(1), 1€ T'} un processus 
stationnaire au sens large, B2(1) et F:(2) respectivement ses fonctions de 
corrélation ct spectrale. Supposons que le processus £(r) (traité comme 
une fonction du temps #) accède à l'entrée d’un dispositif et se transforme 
de FL sorte qu'à la sortic l'on obtienne un nouveau processus {r(1), 
ET). 

La transformation À de ë(r) en (1) := AË(+) s'appelle filtre linéaire 
admissible (ou simplement filtre) si »(#) se représente par 


> 


SO hG—-s)E(s) (« discret) ; 


. 


(4) -- 4 (6.1) 
f hG@-s)Ë(s)ds (4 continu), 


Er 


où (st) sont tels que 


he) B(t2-- 1) 19 (42) < (« discret); 


? 


(6.2) 


> ? 2012 
; ms ? MA 


ha) BG, -1)h%4.)dt, dt; <c  ( continu) 


ct la somme ct l'intégrale de (6.1) sont comprises au sens des limites en 


b 

moyenne quadratique respectivement des sommes SD hG-s)E(s) et des 
8 —4 

intégrales Î h(t-—-s)Ë(s) ds pour a, b->. La fonction (1) s'appelle fonc- 


—. 
tion de transfert impulsionnelle (matricielle) du filtre À. 

Remarque. Cette appellation est liée au fait que si à l'entrée du tiltre 
on applique la fonction impulsionnelle (dans le cas d'un temps continu, 
la fonction delta de Dirac avec singularité en 0) on obtient A(r) à la sortic. 

Soit 


ÿ e "Ah(t) (4 discret) ; 


H(i?) = 
(| e-“Ah(s) dt (t continu) 


la transformée de Fourier de la fonction de transfert impulsionnelle (+). 
La condition (6.2) est équivalente à la condition H(i 2) € L,{Fe}). La fonc- 
tion /7 (5) s'appelle caractéristique fréquentielle (matriciclle) du filtre À. 
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Si à l'entrée du filtre À le processus &(4) admet la représentation spectra- 
le £(1) -- [etai (2), alors le processus (1) admet la représentation spec- 


1. 
tralec (4) =- | c11(i4) dé (à). En particulier, si (4) et nr) sont des 
A 
processus scalaires, alors 4/(52) = | A(i4)le "4, et | /1(5)1 s'appelle coef- 
ficient d'amplification du filtre et y{(À) phase du filtre. 
Le processus »(1) = AË(t)est stationnaire et, de plus, 


> ÿ (tn) Ben — 1) R° (in) — 


— — NN 


Ÿ XII) dFQ) Hi) ( discret) ; 


B,,( ) Se (6.3) 
Î (| h(t-+.0) Ba(v--u0) h* (v) du dv = 
= fe" /I()dF:@)H* (à) ( continu) ; 
dl @) - H{(i)dF: (2) H *(i). (6.4) 
Si existent les densités spectrales /:(2) et /,,(), alors 
An) = 12) Je) HG). (6.5) 


Soient {£ (4), 2€ T}et (nr), 1 € T} deux processus stationnaires au sens 
large quelconques dc fonctions spectrales F4(2), F,(4). Le théorème suivant 
répond à la question : le processus »(#) est-il transformé linéaire de £ (1) ? 

Thévrème de Rosanov. Supposons que les processus {£(t), 1€ T} et 

n(),1 € T}sont conjointement stationnaires, c'est-à-dire le processus vectoriel 

SC), n()), 1€ T} est stationnaire au sens large. Pour que le processus 
{n(), 1 € T} soit transformé du processus {Ë(+), 1 € T} par un filtre de caracté- 
ristique fréquentielle H1(i), il est nécessaire et suffisant que les Jonctions 
spectrales et mutuellement spectrales correspondantes soient liées par les 
relations : 


dF,0) = ÉI(G) dFsQ) H° (0) ; (6.6) 


dFe,,(2) — dFe(2) H*(i). 
11.6.2. Exemples de filtres. 1. Le filtre à bandes laisse passer, sans les 
modifier, les composantes harmoniques d’un processus £(1) dont les fré- 


quences appartiennent à un intervalle donné Ja, b[. Sa caractéristique 
fréquentielle est 
1, À € Je, b ; 


HG) = Ye, 4 Q) = d À € Ja, bI 
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La fonction de transfert impulsionnelle (1) (pour «a et b finis) est : 


et! eh 
ANA | 2rit 


Le filtre à bandes est appelé à haute, moyenne et basse fréquences 
selon la disposition de l'intervalle ja, b[. 
Si a = — out(et)b = , alors la fonction de transfert impulsionnelle 


n'existe pas. 
m1 


2. Dérivation. On peut appliquer l'opération 4 — Ë B, _ aun 
=0 


processus {£(1), 1€ T} à temps continu si et seulement si le moment 
spectral d'ordre 21 


il À" dF: (à) 


est fini. 
La caractéristique fréquentielle Æ/(4)= Y° B,()"-!, En particulier, 
1=0 . 


si À = _. alors /f(iÀ) = iÀ. La fonction de transfert impulsionnelle 


n'existe pas. 

3. Equations différentielles. Considérons un filtre défini par une 
équation différentielle linéaire à coefficients constants Ln(1) = AfE(+), où 
L et ÀAf sont des opérateurs différentiels 


4 ds £ dm) 
| ARE = \1 3, ,-—. . 
REA C; dt*-s ? A1 2? dim) 


On suppose qu'existe le moment spectral d'ordre 2x du processus Ë(r). 


| MG) Le 
Si LG € L.{Fe}, où L(i)-- sa COQ), M) = D B,(i)""1, 
il existe un filtre correspondant à l'équation différentielle Concitiérée de 
caractéristique fréquentielle 77(52) -- en . 


11.6.3. Filtres physiquement réalisables. Dans les liltres définis par l'égalité 
(6.1), les valeurs de sortie du processus {0), 1€ T} à l'instant # peuvent 
dépendre aussi bien des moments antérieurs (s </) que des moments 
postérieurs (s => #). 

Les installations réelles sont privées de la possibilité d'anticiper. 
Aussi, si un filtre simule un objet réel, sa fonction de transfert impulsion- 
nelle A(r1) doit satisfaire la condition de réalisabilité physique : 


h({t)=0, 1<0. (6.7) 
Les filtres remplissant la condition (6.7) sont dits physiquement réalisables. 
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Théorème f, Pour qu'un processus scalaire KE), 1€ TT) de fonction 
spectrale FQ) soit la réaction d'un filtre physiquement réalisable à l'entrée 
duquel est appliquée une suite non corrélée standard {&,(), t ET} (dans le 
cas de t discret) où un processus standard à accroissements orthogonaux 
(o(), ET} (dans le cas de t continu), il est nécessaire et suffisant que sa 
Jonction spectrale F(À) soit absolument continue et que la densité spectrale 
JC) vérifie la condition _ 
a 
{In ZA) dà >. (t discret) ; 

- À 


(6.8) 


] In oi > 0 (4 continu), 


. (> 


Sous ces conditions, à la sortie d'un filtre physiquement réalisable le 
processus {Ë (+), 1€ T} se représente par 


t ee: 
SO) = hG-9 605), D AGE <> (tdiscrer) ; 
_ t -0 
4 EN (6.9) 
ct) | Ut — 3) dos), Î LAC) dt <es (4 continu). 
= 0 
Remarque, La deuxième des égalités (6.9) se rencontre parfois sous 
la forme 
t 
Eu) f AGU-s)cG@) di, (6.10) 


—_" 


où #(1) est un processus de bruit blanc qui cst un processus général station- 
naire au sens large, Er (1) - 0, Ee(r)e(s) = 9-5), où Ô(r) est la fonction 
delta de Dirac. Ceci permet d'interprèter £(1) comme la réaction d’un 
filtre physiquement réalisable à un bruit blanc. 


11.6.4, L'actorisation de lu densité spectrale. Si le temps / est discret, la 
densité spectrale /(4) vérifiant la première des conditions (6.8) admet la 


décomposition A 
| | À) 12 
10) = tre AE, (6.11) 
où g(e7/) est la valeur frontière de la fonction analytique 
El 
Lx l e-"4z 
g(z) = V21 exp . [in SO = d}*, 
— 7 
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c'est-à-dire 
r(e="À) = Jim pue"), 
ct! 


ct de plus 


ne ['eébpte-t di, pet) = Ÿ ntpe-v 
. t—0 


—1 


Si le temps ? cst continu, la densité spectrale / (4) satisfaisant la deuxième 
des conditions (6.8) admet la factorisation 


TORTUE (6.12) 


où (5) est la valeur frontière de la fonction analytique sur le demi-plan 
de droite 


| | À + À 
ES 1e Ÿ —— _ = ——- Â 
es Van JTE re nf 
et de plus 


_ I ns nl 
hu) =. ] eq. (i2) de. 


— 


L'analoguc vectoricl du théorème ! s'énonce sous une forme plus 
simple dans le cas où le processus {5(4), € T} admet un rang maximal 
à la sortie du filtre, c'est-à-dire la densité spectrale / (2) possède un déter- 
minant presque partout non nul pour la mesure de Lebesgue. 

Théorème 2. Pour qu'un processus vectoriel (5), 1€ T} de rang maximal 
de fonction spectrale F() soit réaction d'un filtre physiquement réalisable 
à l'entrée duquel est appliquée une suite standard de vecteurs aléatoires non 
currélés ($,0(4), 1€ T} (dans le cas de t discret), où un processus standard 
à accroissements orthogonaux de dimension K{Go(t), 1€ T) (dans le cas 
de t continu), il est nécessaire et sufisant que la fonction spectrale F(À) soit 
absolument continue et que la densité spectrale (à) vérifie la condition 


[In det{/(2)} di = (4 discret) ; 


—1 
2 (6.13) 
In det [/(2)] . Dr 
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Si ces conditions sont remplies, le processus {n(4), 1 € T} obtenu à la sortie 
du filtre physiquement réalisable peut s'écrire 


n(t) = S hG@—s)£o{s), Tr Ÿ hG)h°(1)< (4 discret) ; 
0 {=0 
! co (6.14) 
n(t) = f h(t—s)£o(ds), Trf hs) h°(1) dt <>  (t contimi). 
0 


LE 


Si # est discret, la densité spectrale / (4) vérifiant la première des con- 
ditions (6.13) admet la factorisation 


Pt) = 3e rer )gt (er), (6.15) 


où la matrice g (e-‘*) de dimension 4 X & est la valeur frontière de la matrice 
analytique à l'intérieur du cercle unité y (2), définie de façon unique par les 
conditions 


lim (0e) q* (0e) = 2x fn) ; 
ot! 


| det z (0) © = (27)* exp L [ In det ([/n(2)] d2, . 


1 


11.7. Processus à densités spectrales rationnelles 


11.7.1. Théorèmes de factorisation. On dit qu'une densité spectrale / (2) est 
rationnelle si elle ou ses éléments fu), dans le cas où /(2) est une matrice, 
P(e”") P(i}) ! : 
OC”) OU) (: continu), où P(z) et 
Q(z2) sont des polynômes quelconques. 

Les processus à densité spectrale rationnelle se représentent par des 
processus de sommation glissante, les processus vectoriels possèdent, de 
plus, un rang constant. 

Le principal résultat concernant cette classe de processus station- 
naires est contenu dans les théorèmes de factorisation. 

Théorème 1. Si /' (2) est densité spectrale rationnelle d'un processus 
stationnaire à temps discret, elle admet la factorisation 


1 | Pe”#) | 


21 | O(e-") 


SU) = (7.1) 


_ Be-") B*(e-") (processus vectoriel), 


se représentent par (4 discret) ou 


(processus scalaire) ; 
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(] 
où les polynômes P(2) :: > m2 et QG) = Ÿ q2 ne possèdent pas de 


zéros à l'intérieur du le ie et de plus, si f(4) = f(-—2À), alors les 
coefficients p,, 1 = 1, ...,p,et a, 1= 1, ...,Q, peuvent être réels ; B(2) 
est une kXr-matrice analytique dans le cercle unité (k est la dimension du 
processus, r, son rang ), dont les éléments sont des fractions rationnelles en z. 

Théorème 2. Si /(À) est densité spectrale rationnelle d'un processus 
Mtationnaire à temps continu, elle admet la factorisation 


- 


LP 


{processus scalaire } : 


_ 27 | 
J() -- (7.2) 
5: Bi) B*(i2) (processus vectoriel), 


où les polynônies P(z) = D m2 et Q(z) = pa qzne dents pas de zéros 


dans le demi-plan in férieur. 5 si, de plus, f @ = {(— À), alors les polynômes 
P(iz) et Q{(iz) possèdent des coefficients réels ; B(z) est une KXr-matrice 
(& est la dimension du processus, r, son rang), analvtique dans le demi-plun 
inférieur, dont les éléments sont des fractions rationnelles en z 

Les théorèmes de factorisation nous fournissent les représentations 
spectrales suivantes des processus dont les densités spectrales sont des 
fractions rationnelles en : : 


7 


‘À 
= | ou PEUT yet) 
Q(e- * 


ee” 


(processus scalaire à temps discret) ; 


(7.3) 
. | P(iÀ : 
SC) — JE ce! on " dot) 
(processus scalaire à temps continu), 
où 6) est un processus standard à accroissements orthogonaux : 
4) — [et Rte") di402) 
- 4 
(processus vectoriel à temps discret) : 
(7.4) 


EG) = [et BG) dE) 
(processus vectoriel à temps continu), 
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où &,(2) est un processus standard de dimension r à accroissements ortho- 
gonaux, 7 le rang du processus {£(z), 1 € T}. 


11.7.2. Exemple. Les exemples suivants de processus stationnaires scalaires 
à temps discret T = {0, +1, +2, ...} décrivent complètement la classe 
des processus dont les densités spectrales sont des fractions rationnelles. 

1. Processus à moyenne glissante. Soient {4,(1), 1 € T'} une suite non 
corrélée standard, a,, / — 0, ...s P, Une collection de Joe réelles. 
Le processus {£(r), 1 € T}, où E(t) = ao) +@boft-- D 4... 1 4,6a(t—p), 
s'appelle processus à moyenne glissante d'ordre p. 

Sa densité . est 


HOE 53 |“ +aer4+...+a ec traf, 
Sa représentation spectrale est 


bu 
ë(t) — (| ea +ae "4 +...+a,e7"] di (à). 


1 


En particulier, si à, -- p11° 1: 0,...,p, alors 


sint + CU 


(2) ao? 
POIERSSRSSS ar ES 
FT ane ) 
4 e”!! 4 À 
EG) — s Linge = eh do). 
À 
(pt1) ue Le”! 


2. Processus autorégressifs. Soit {6,(1), € T} une suite non corrélée 
standard. Considérons l'équation aux différences finies pour la détermina- 
tion du processus {£ (1), 1 € T} : 


EC) EG-D +... +b,5G— 0) = 0bo(). (7.5) 


L'équation (7.5) est identique à l'équation de régression linéaire ensembliste, 
donc si elle admet une solution en tant que processus stationnaire au sens 
large, cette solution s'appelle processus autorégressif d'ordre q. L'équation 
(7.5) admet une solution stationnaire si les zéros du polynôme Q(z) = 
= 1+b,z+...+0b,2 sont situés en dehors du cercle unité. 

La densité Ru cst 


__{ 
SG) = —- — RE , 
22 |lthje-A+.. .+b,erta |? 
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La représentation spectrale est 


£(t) = fe __ d8oQ) | 
1+bie-4+...+b,e"t 


où &,(4) est un processus standard à accroissements orthogonaux. 

Remarque. Un processus autorégressif d'ordre 1 est markovien au 
sens large. 

3. Modèle mixte autorégressif et de sammatian glissante. Supposons 
que 7'et {5,(), 1€ T} sont les mêmes que ceux des exemples précédents. 
La combinaison des modeles autorégressifs et de sommation glissante 
conduit à l'équation 


EG) +b EU D +h,EG 2) +... + b,E(- 0) = 
= SG) +aÈG- D) +... -+a (Gp). (7.6) 


Si les zéros du polynôme Q(z) — 1+b,z+...-+b,zsontsitués à l'extérieur 
du cercle unité, alors l'équation (7.6) possède une solution stationnaire 
{Ë(t), ET} appelée processus mixte autorégressif et de sommation 
glissante d'ordre (p, q). 

La densité spectrale est 


ayt+ae- +... a et | 


à Ù 
114) = — 
Ltbhie- "4... + be” 


27 


La représentation spectrale est 


7 
. + 1 1. . —1pà 
(= [gi MER RE ge (3 
. Itbhitar+...4b,e-td 
Il est remarquable qu'on peut décrire de façon adéquate les phéno- 
mènes observés en pratique et simulés par des processus stationnaires à 
l'aide d'un modèle (mixte) autorégressif et de moyenne glissante d'ordre < 2. 


11.8. Prédiction, lissage et filtration 
des processus stationnaires 


11.8.1, Problèmes généraux de prédiction, de lissage et de filtration. 

1. Prédiction (extrapolation). Supposons qu'on observe un processus 
stationnaire au sens large {£(1), 1€ T} aux instants 2€ T5, où Ts = 
= (1ET:1<to}) où Ts ={tET:10—-h<1<to}, h>0. On demande 
de donner sur le vu de ces observations la meilleure prédiction en moyenne 
quadratique de ce processus à un instant #* = +7, 7 > 0, c'est-à-dire 
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de trouver une fonctionnelle (1°) — g(5(1), 1€ 7) des valeurs du pro- 
cessus £ (1) aux instants s € T, telle que 


EllEG*)-n(@9)Iif <ElÉG*)-7G4*)1F, (8.1) 


où 7,(+1*) est une autre fonctionnelle arbitraire des valeurs du processus 
ë(t) aux instants # € 7. 

2. Lissage (interpolation). Supposons qu'un processus {£(1), 1€ T} 
est observable aux instants 1€ 7, © T, que 1° ET est un instant tel que 
1 & Pet qu'il existe des #,€ Ti, à — 1, 2, pour lesquels 1, < 1° = 1... 

On demande sur le vu de ces observations du processus {5(1), 1€ T} 
le meilleur critère en moyenne quadratique d'interpolation de la valeur 
du processus {5(1), 1€ T} à l'instant #*, c'est-à-dire de trouver une fonc- 
tionnelle (1°) = gse {E(1), 1 € TS} des valeurs du processus #(r) aux instants 
1€ T, pour lesquels a lieu la relation (8.1). 

3. Filtration. Supposons qu'aux instants # € 7, © T° on observe un 
processus Ë(1) — s(1)+9(1), somme d'un signal utile s(4) et d'un hruit 
O(+), où s(1), et 0(r) sont des processus stationnaires et non corrélés. 

On demande de séparer (filtrer) le bruit 2(1) du signal s(r), c'est-à-dire 
de trouver une fonctionnelle »(1*) = g,.(£(1), 1 € Ta) des valeurs du pro- 
cessus £ (7) aux instants / € T, telle que 


Ells@*)-n(@)lf <Els(G*)-2, (9), (8.2) 


où ?7,(1*) est une fonctionnelle arbitraire des valeurs du processus £(r) 
observé aux instants 1€ 7,. 

Les premiers membres de (8.1) et de (8.2) sont appelés respectivement 
erreur de prédiction et de lissage et erreur de filtration. 

La solution générale des problèmes formulés est donnée par le théo- 
es suivant (qui, du reste, est vrai pour tout processus aléatoire hilber- 
tien). 

Théorème. Soit Ÿr, la tribu engendrée par les valeurs du processus 
{£(), 1ET} aux instants 1€ Ts. La meilleure fonctionnelle en moyenne 
quadratique qui donne la solution du problème de prédiction, de lissage ou 
de filtration est de la forme 


n°) — E(SG*)/àr,}. (8.3) 


Malheureusement ce théorème n'est pas d'un grand intérêt pratique, 
car le calcul du second membre de (8.3) est excessivement laborieux. 


11.8.2. Problèmes de prédiction, de lissage et de filtration linéaires, On les 
considère dans une forme plus simple : on cherche (1°) dans la classe des 
fonctionnelles linéaires des valeurs du processus {£(1), 1 € T} aux instants 
tE To, C'est-à-dire 


n(*) — CS E(s)  ( discret), (8.4) 


ET 
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ou bien 
nG*)= [ C(DË(S) ds (r continu). (8.5) 
Te 


Si # est continu, la fonction C(s) de (8.5) est une distribution même 
pour les classes relativement simples de processus. 
L'étude des fonctionnelles linéaires de la forme 


n(%)= [ed C(GA)dEO), (8.6) 


— 


où € (4) est un processus spectral associé au processus {£ (1), 1€ T} (eesra. 


dire Î eMd(2) = so) permet de procéder à l'analyse sans faire appel 
directement aux distributions. 

Les problèmes de prédiction, de lissage et de filtration linéaires admet- 
tent une interprétation géométrique simple. 

Soient He l’espace des valeurs d'un processus {£(r), 1€ T}, He(To) 
un sous-cspace fermé de He, adhérence dans He de l'enveloppe linéaire des 
variables aléatoires £(1,), 1,€ Ts, j = 1, ..., N. Les problèmes de prédic- 
tion ct de lissage linéaires consistent à trouver des quantités 1°), projec- 
tions des valeurs inconnues &(1*) sur le sous-espace He(To) ; le problème 
de filtration linéaire, à trouver des quantités (1°), projection des valeurs 
inconnues s (1°) du sous-espace #4, © He sur le sous-espace He (To). 

Supposons qu'on observe aux instants ET. CT un processus 
stationnaire {£(r), 1€ T} de fonction de corrélation Be(r), que {n(r), 
1ET} cest un processus stationnaire stationnairement lié à {£(), 1€ T}et 
que B%e(t) est leur fonction de corrélation mutuelle. 

Si l'on suppose que l'estimation fj(1°) de la valeur du processus {r}(r), 
1 ET} non observé à l'instant #* € Test de la forme 


8, Ce(s)£(s)  (t discret) ; 


1°) = | 
ñq°) | Ce(s)i(s)ds (1 continu), 
Te 
alors la fonction C',.(1), 1 € T., appelée fonction de transfert impulsionnelle 
du filtre linéaire optimal, peut être cherchée comme la solution de l'équation 
linéaire (intégrale) de Fredholm de première espèce de noyau hermitien : 


x Cios) Bes—1) = Bie(t*-1), 167, (rt discret) ; 
1ETe 

N.7 
f Ce(s) Be(s—-1)ds = Rye(t*—-1), 1673 (continu). En 


Te 
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Si, parexemple, 7, — (1€ ]-c, cf: 1 << 16} 1% — 10 1 7, la deuxième équa- 
tion (8.7) s'écrit 


te. 
Î Cros) Be(s-u) ds = Bt -u), u«to; 
si l'on fait le changement #,-—10 =— v, 10-- 5 — z, la dernière équation devient 


(] Coto—2z)BeCv—-2)dz - Bet Lo), v - 0. (8.8) 
0 


Si l'équation intégrale (8.8) admet une solution, alors C:(:) = CC, (9-2) ne 
dépend pas de f,, d'où 


Î Crts) BeG-s) ds = B(r+9, 170, (8.9) 
0 
et le processus de prédiction s'écrit 
{ os 
DO)= [ CES) ds = [CD EG -S ds ; 
— [1 


l'erreur est 


= Be) [ [ CC) BG) CC) ds di = 
0 0 


= B:(0)— [ IC: GA) dFeQ), 


—- 


où Fe&(4) est la fonction spectrale du processus &(r), C'(i2) — (| Ce di 
o 
est la caractéristique fréquentielle du filtre optimal. 


11.8.3. Méthode de Wiener. L'équation intégrale (8.9) peut être résolue, 
moyennant des conditions subsidiaires, par une méthode proposée par 
N. Wiener. Plus exactement, supposons qu’un processus {Ë(1), 1€ T} est 
absolument continu, que sa densité spectrale /:(/) admet une factorisation 
de la forme 


2 


I 1] 2 Ù Ti , æ -— 
RO) = 5 IG, 4@) | e_"th() dt, Rez--0, 
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et que /:(2) est la densité spectrale mutuelle des processus {£(1), 1 € T}ct 
{n(t), 1 € T}, la fonction k(i2) = étant de carré intégrable, de sorte 
P 


que 
BG) [ 40) dà - 
= f eu k(ï2)q(ià) di = (| br +5) A(s) ds, 
— 00 0 
où 
bu)= [fe k(2) d2. 


L'équation (8.9) peut s'écrire 


f [b(r +1 +5) - f Cr) (t + 5-0) du] {s) ds =0, #1>0. 
[s) 0 


La dernière égalité est réalisée si 


br +1) = f Cr) ht u) du, 1>0, (8.10) 
0 


ou 


t 
b(r+r)= Î Cr) ru) du, 1 > 0. 
0 


On résout l'équation (8.10) à l’aide de la transformation de Laplace : 


e x Br(il) 
GOE Lean 


di, (8.11) 


où 


B,(2) = [ br+x)e-" dx = | RO) 9 
J : (2) z—i 


11.8.4. Méthode de Yaglom. Comme indiqué au numéro 11.8.2, la fonction 
de transfert impulsionnelle C; (+1) d’un filtre optimal peut ne pas exister 
(ou plus exactement, peut exister seulement comme distribution). Dans ces 
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cas, on a intérêt à faire appel à la caractéristique fréquentielle C’, (52) du filtre 
optimal correspondant. 
Si donc T,={1E]-c, of: 1= 0h 1° = tot, € ËG) = 
vw ee 


= Î cu dée(à), et (4) = I] cdi,(à) sont des processus station- 
nairement liés, respectivement de densité spectrale fe() et /(À) et de 
densité spectrale mutuelle /,:(2), le processus £(1) étant observé sur 7,, 
alors on cherche la caractéristique fréquentielle C,(52) d’un filtre linéaire 
optimal, c'est-à-dire une fonction telle que pour 1° = +7 


ju)= fe“ C)diG), [CGJ /eQ) di < oo. 


La méthode de Yaglom nous fournit une procédure nous permettant de 

trouver la caractéristique fréquenticlle comme une fonction définie de façon 

unique par certaines conditions. 

ï Théorème de Y'aglom. Si /a densité spectrale f:(2) est bornée, les con- 
itions : 


a) Î IC:G)F RC) da <o ; 


b) Cid) est valeur frontière de la fonction C;{(z) analytique dans le demi- 
plan de droite, croissant pour | z|->° pas plus vite qu'une puissance de |z] ; 

c) fa fonction y{ià) = er f,:(À)—C;(i2) fe(2) est valeur frontière d'une 
fonction y(z) analytique dans le demi-plan de gauche, telle que 


(| [px +6) dj <c pour x <0, 


— 


définissent de façon unique la caractéristique fréquentielle C; (2) du filtre 
optimal estimant la quantité 


n°) = (to +T). 


L'erreur quadratique moyenne de l'estimation optimale est 


(=. 3 


0? = Elyn(o+t)-ÿ(o+T)l= B(0)— | 1G:(5à) fe) à2. 


Exemple. Considérons le problème de prédiction pure d'un 
processus {£ (1), 1 € T} dont la densité spectrale est une fraction rationnelle, 
c'est-à-dire &(1) = n(r), 

1  |P(i)P 


fe) = 37 lOGDE 


17 — 26002 257 


où P(z) et Q(z) sont des polynômes de degré p et q respectivement, dont les 
zéros sont situés dans le demi-plan de gauche. 

Si zP? et z° sont les zéros des polynômes P (z) et Q(z), on a les repré- 
sentations 


PG@=alIl(t-2#»5, Ya=p; 
ji 


J=1 


QG)=bIIG-#, ŸB,=a. 


J=1 j=l 
Soient 


P,G)=(-1}aïIl (+2 ; 
j=l 


Q,()=(-D'hII (z+25 0. 
J=1 
Le prolongement analytique de la fonction y(iÀ) = [e}"—C;(i)]'E(À) est 
de la forme 0 
= [er I) 14 
p(2) [e” Cr (2)] Q(2) Q,(2) 


Le théorème de Yaglom exige que la fonction C-(z) soit de la forme 


e M:(2) 
Cr(2) = P(2) 
où M, (2) est un polynôme de degré m, = p—1 tel que 
dME|  _dC"'rG) 
a 0 d2) 0? j=0, ss Us K=1,...,n. 


11.9. Décomposition d’un processus stationnaire 


11.9.1. Décomposition de Wold. Soient T, = {1ET: 1<t0} et He(To) — 
= He (to), H = N H go). On a deux possibilités pour le sous-espace 
Er 
Hà : 
Hi = Hg et His He. 

Dans le dernier cas, la situation est extrême pour H£ = 0 (espace trivial 
composé du vecteur nul). 

| H%= He, le processus {£(1), # € T} s'appelle singulier (ou détermi- 
niste). 


258 


Si Hg cst un sous-espace propre de l'espace 7/4, le processus {5 (1), 
1€ T}est non déterministe. 

Si /1: = 0, le processus {£(1), 1 € T } est dit régulier (ou complètement 
non déterministe). Du point de vue des problèmes de prédiction (linéaire), 
la singularité du processus {£(1), s € T} signifie que sa prédiction linéaire 
D) = 9°), 1% —-1+7,T — 0 est infaillible pour tout temps + à l'avance, 
c'est-à-dire 

et)  ÈGAT). 


Si le processus {5 (1), 1 € T} est régulier, la meilleure prédiction linéaire 
pour un futur infiniment éloigne consiste à définir la moyenne, c’est-à-dire 


lim (4) = Et(t) = 0. 


T—+00 


Soient {£(r), 1€ T}et {y(r), 1 € T} des processus stationnaires d'espaces 
de valeurs He et Ff,, respectivement. Le processus {»(r), 1 € T} est complète- 
ment subordonné au processus {£(1), 1 € T} si Æ4,(+) © He(t) pour tous les 
tET. 

Théorème 1. (Décomposition de Wold). Tout processus stationnaire 
{Ë(), 1 ET} peut être représenté de façon unique sous la forme 


EC) = É'(1)+E"(r), (9.1) 


où E'(t) et é"(t) sont des processus non corrélés, complètement subordonnés 
au processus {Ë(t), 1€ T}. 

Le processus E(t) est singulier, le processus £"(t}), régulier. 

Les quantités £’(1) sont les perpendiculaires abaïssées de £(#) sur le 
sous-espace /7?, les quantités £’(), leurs projections respectives. 


11.9.2. Composantes régulière ct singulière d’un processus stationnaire, 
Soient F(À) la fonction spectrale d’un processus {£(4), € T}, (À) = F,(4) + 
+F,()+F.(à) sa décomposition de Lebesgue, où F,(4) est une fonction 
absolument continue, F,(À), une fonction constante par morceaux, F,(À) une 
fonction continue possédant une dérivée presque partout nulle par rapport 
à la mesure de Lebesguc. F,(2) est la fonction spectrale de la composante 
régulière £" (r), F2(4) + Fa(À) la fonction spectrale de la composante singulière 
&(1). La composante singulière (le processus singulier) peut en principe 
être prédite sans erreur. 

Exemple. Soit {£(r), : € T} un processus stationnaire à temps dis- 
cret dont la densité spectrale est constante par morceaux : F:(À) = F0), 
c'est-à-dire le processus est singulier. 

On demande la prédiction linéaire ï-(f) du processus {£(r), 1€ T} 
d'après les observations aux instants s = #0, c’est-à-dire de trouver «, 
k > 0, tels que l'erreur de prédiction 


oo 2 


E 16 (to +7) — x (fo) l° = [son 22, 225 ok) 


soit minimale. 
17° 259 


L'erreur de prédiction pouvant être représentée sous la forme 


7 
BeO)— [ 3 œxaet"-2i dFe(à) 


-1 k,1=0 


et F2(2) étant constante par morceaux, on peut indiquer des «, tels que 


BeO)- |  œae"-24 dFe() = 0, 


—1 
c'est-à-dire la prédiction peut en principe être réalisée sans erreur. 
On appelle singuliers des processus scalaires dont / (2) = TT (4) 


s'annule sur un ensemble de mesure de Lebesgue positive, ou bien 


[In F4) da = (1 discret) ; 


on Li 


fin FnQ) dà _ 


147: (t continu). 


ñ © 
Si J In FC) dà > — =| Î An QE > — -) , alors les com- 


7 — 


posantes régulière et singulière de tels processus sont égales à 
&@)= fetdt(Q), &(4)= [eh dO), 
© (4 


où Ë(r) = fer d% (À) est la décomposition spectrale du processus {£(r), 
ET}; 0 € A l'ensemble négligeable pour la mesure de Lebesgue sur le- 
quel sont concentrés les points de discontinuité (de croissance) de la fonc- 
tion F:,(4)+F2(4) ; Go le complémentaire de 0, dans À. 

Tout processus stationnaire vectoriel de rang 1 est soit régulier soit 
singulier. 

Etant donné que la composante singulière d’un processus stationnaire 
peut être prédite en principe sans erreur sur un passé infiniment éloigné, 
seuls les processus réguliers présentent le plus grand intérêt dans les problè- 
mes de prédiction, de lissage et de filtration. 

Théorème 2. Pour qu'un processus stationnaire scalaire soit régulier, il 
est nécessaire et sufisant qu'il soit réaction d'un filtre physiquement réali- 
sable à l'entrée duquel est appliquée une suite non corrélée standard (si t est 
discret) où un processus standard à accroissements orthogonaux (si t est 
continit ). 
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La condition du théorème 2 est nécessaire et suffisante pour qu'un 
processus vectoriel de rang maximal soit régulier. Les processus dont la 
densité spectrale est une fraction rationnelle sont réguliers. 


11.10. Résolution de problèmes de prédiction, 
de lissage et de filtration linéaires 


11.10.1. Prédiction linéaire (extrapolation). Soient {£(1), 1 € T} un processus 


I : 
régulier scalaire à temps discret, /(4) :: 2x ge") {À sa densité spectrale, 


E(t) = f e4 d£(i) sa représentation spectrale, £(1) = ÿ CG-s)ba(s) 


= 
sa représentation sous forme d'un processus de sommation glissante, 
Ÿ IC) <o0. 
{=0 


Théorème 1. La meilleure prédiction linéaire (1) de la valeur E(1 +7), 
T > 0, sur le vu de Es), s <& 1, avec un temps + à l'avance est donnée par la 
formule 


à 1À 
E (4) = [mt re dt). (10.1) 
g(e-") 


où 
re = À Coperd gite = À Care tt 
les 1-t 


L'erreur de prédiction 6? = E|£E(t+7)—£,(4) 1 est 


s—0 


= Ÿ C(s) = 22 2e Le ] In pal ÿ d, , (0.2) 


où d, sont définis à partir de 


7 


1 © x | LS 
Cxp . » z" ] ec" ]n / (2) a] = 2. d, 2". 


CES | 
1 


En particulier, 
a? = 27exp E J In /(2) d2°, (10.3) 


oh 0) | . 
c'est-à-dire = est la moyenne géométrique (continue ) de la densité spectrale. 
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Exemple 1. Soit {È(4), 1€ T'}, T= 0, +1, +2, ... un processus 
markovien au sens large, de fonction de corrélation B(1) = ae”al'l, 
« > 0. La densité spectrale / (4) est 


o? 1- ff , 
POSE Poe” 
27 |1-fe-"*}° 

La meilleure prédiction linéaire avec un temps r à l'avance est donnée 
par la formule 


E(1) = Î clear dé (2) = e72TË (1), 
— 71 


où & (À) est un processus spectral correspondant au processus {£ (#), 1 € T}. 
L'erreur de prédiction est 


o$= u?(1—e-%), 
Soient {£(1), 1€ T} un processus régulier vectoriel de rang maximal à 
temps discret, /(4) -- ge") g* (7°) la densité spectrale (matricielle), 
EL 


Ê(t) = (| et 4 (2) la représentation spectrale et supposons que la matrice 


—n 
p(z) se décompose en la série 


ge) = ÿ burn. 


‘Eéorème 2. La meilleure prédiction linéaire Ë () pour un temps t à l'a- 
vance est donnée par la formule 


7 ri 
£G)= [ ein sen E yet g='(e"") d& (à). (10.4) 
7 n=0 


La matrice des erreurs de prédiction en un pas à l'avance est 
G = 1 Al g* (0). (10.5) 


Exemple 2. Soit {5(1) = £,6), ..., 4), 1€ T}) un processus 
mixte autorégressif et de moyenne glissante dont la densité spectrale est de 


la forme 
1 


SO) .,2 Be") 4 (e71) GA (e7") B°T 1e"), 


où A(z) et B(z) sont des polynômes matriciels, 4 (0) — A(0) : l (ak XE- 
matrice unité), det G 7 0. Ici pe”) — B71(e-4) A(e°)G3, La meil- 
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leure prédiction linéaire £, (1) est donnée par 


ÉG)= À CEG-N), 
n 0 
où C, sont définis comme les coefficients du développement Y C2 = 
n=0 


— (42 b,z" gs" (2). La matrice des erreurs de prédiction à un pas à 

Rn=TYT 
l'avance est confondue avec G. 

En particulier, dans le cas d’un processus autorégressif (4 (2) = 1) la 
meilleure prédiction à un pas à l'avance est déterminée d'après les valeurs de 
EE), E(G—1),..., E(t—0Q), où g est le degré du polynôme B(z). 

Soient £(1) un processus régulier scalaire à temps continu, /(À) = 


= _ lg (i) |? sa densité spectrale, £(1) = Î el dt(A), sa représenta- 
: — © 
tion spectrale, (1) — [ Ces) dé (s) sa reprèsentation sous forme d'un 
processus de sommation glissante. 
Théorème 3. /.« meilleure prédiction linéaire Ex (+) à un temps + à l'avance 
«a pour expression 


&(e) = I PAT rn dEG), (10.6) 


où 


q@)= [f C(e-ds, gi = [ C(e-d ds. 
0 r 


L'erreur de prédiction est 


u? = (| La(s) * ds. (10.7) 


Excmple 3. Soit {£(1), 1€ T} un processus autorégressif dont la 
densité spectrale est de la forme 
Ï | 
G) = S- -s, 
FO 37 joue 


où Q(z) est un polynôme de degré 4 — 1 dont les racines B,, j = 1, ..., q, 
sont simples et à parties réelles positives. La meilleure prédiction linéaire à 
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un temps 7 à l'avance a pour expression 


dd 


bi+iÀ 


. e 
&U)= | et Y'e-ur dé () = 
J À ll b,—b, 
= Le é bjr Il ( " 5) E(t). 
jei l #) b,—b dt 


11.10.2. Interpolation d'une valeur omise. Soient T = {0, +1, +2, ...} et 
{£(4), 1 ET }un processus stationnaire de fonction spectrale F(2) absolument 
continue. Supposons connues les valeurs £(s), s  /,. On demande la meil- 
leure interpolation (linéaire) É(,) de la valeur omise £ (#.). La quantité 


d* (processus scalaire) ; 


E{£ (0) — Ë (o)] [£* Go) —E* (c0)] = G (processus vectoriel) 


s'appelle erreur (matrice des erreurs) d’interpolation de la valeur omise, 
ñ 
Théorème 4. Si {5(r), 1€ T} est un processus scalaire et f Fe «en, 


71 
où [ (à) est sa densité spectrale, la meilleure interpolation linéaire Ë(t,) de la 
valeur omise £(t) a pour expression 


Eu feu 2% |acc, (10.8) 
se - dy 
SO) En 


où &(À) est un processus spectral pour {E(t), 1 ET}, l'erreur d'interpolation 
étant 


= ——— , (10.9) 


Soient {£(1), 1€ T} un processus vectoriel, / (2) sa densité spectrale 
matricielle. Désignons par /‘*"(2) la matrice inverse de / (À) (si det / (À) = 0) 
ou la matrice inverse généralisée (si det (2) = 0). Ceci signifie que ft" (2) — 
= ([/(0)+117(4)) !—1IT(2), où ZI(À) est définie de façon unique à partir 
des relations : #(2) Z1(2) = 71(2)/(4) = 0, II(À) = 11*()). 

Théorème S. Si {£(1), 1ET} est un processus vectoriel et la matrice 
SV) intégrable, la meilleure interpolation linéaire &£(t,) de la valeur 
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omise Ë(t0) « pour expression 


71 7 — 
É(t) = J et pH fre a] va dE), (10.10) 


—1 


où 6(2) est un processus spectral pour {Ë(t), t ET}, la matrice des erreurs 
d'interpolation étant 


=: (-1) 
G= sr | f 00) a] ; (10.11) 


— fn 


Excmple 4. Soit {ë(1), ET} un processus markovien au sens 
large de densité spectrale 


[ 1 — f° ” 
Re 6 
JS) 2x life af B=e a 


La meilleure interpolation linéaire Ë(1,) de la valeur omise est donnée par 


; 
PE EL 
É (to) Je pe le +e7] di 0) 


sh dir = 
= LE So + 1) r I + FF So 1). 


L'erreur d'interpolation est 


11.10.3. Interpolation des valeurs d’un processus stationnaire à temps 
continu par les observations à des instants discrets équidistants. Soit {& (+), 
1€ T} un processus stationnaire scalaire à temps continu dont la fonction 
spectrale F(4) est absolument continue. Supposons qu'on observe les va- 
leurs Ê(n), # = 0, +1, +2, ... 

me 6. La meilleure interpolation linéaire £() du processus 
{£(), ET) sur le vu de E(u), n-- 0, #1, +2, ... «a pour expression 


Ÿ f@+220 arm 
EG)= | ed EG), (0.12) 
S  f(G+211) 
{= - 
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où [ (À) est la densité spectrale du processus {È(), 1€ TY et #2) son processus 
spectral, L'erreur d'interpolation 


ÿ fO+27l)et 
_— ——— - | f(À) di. (10.13) 
SO fU1271) 
de: vw 


ou — 1 


me — — 


. 


Si, en particulier, #° = 0, alors le processus {£(r), 1 € T} peut être interpolé 
sans erreur sur Îles valeurs de ë(u), # = 0, +1, +2. Pour cela il est nécessaire 
ct suffisant que / (4) s’annule en dehors de l'intervalle {—:7, 7]. Dans cc cas 
on a la formule de Kotelnikov-Shannon 


#9 D MAL si) (0.14) 


11.10.4. L'iltration linéaire. Le problème de filtration qui consiste à séparer 
un signal s (4) sur le vu d'un processus stationnaire £ (1) = s(4)-+9(1) admet 
la solution la plus simple dans le cas où il est possible d'observer les valeurs 
du processus & (#) sur l'intervalle de temps tout entier. 

Soient {£(1), 1€ T} un processus stationnaire scalaire de fonction 
spectrale absolument continue Fe(À), /e(À), /,(2) et /9(2) les densités 
spectrales des processus £(t), s(4) et 0(1) respectivement. 

Théorème 7. La caractéristique fréquentielle du filtre optimal de sépara- 
tion du signal s(t) est de la forme 


F1) =: - s, (10.15) 


ct l'erreur quadratique moyenne de filtration égale à 


PACE 
LE Jy(2) di. 10.16 
] F0 #0) (10.16) 
Soient {£(4), 1€ 1°} un processus stationnaire vectoriel de rang maximal 
de fonction spectrale matricielle F&(À) absolument continue, AONAUL 


Lo(2) les dérivées des fonctions spectrales Fe (4), F,(4) et F9 (2) par rapport à 
la mesure #(d2) = Tr dFe (À), c'est-à-dire 


fareQ) = [C)a@a), [ar Q) = [,G)a(@?), 
r r r r 


[ dFoQ@) = Î fo G) n(@?). 
r r 
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Théorème 8. La caractéristique fréquentielle du filtre optimal de sépara- 
tion du signal s(t) est de la forme 


H() = À, Q)JE"O), (10.17) 
et la matrice des erreurs de filtration égale à 
[ZOÉ "Q) fe Q) nd). (10.18) 
x 


Soient £ (1) = s(1) + 0(7) un processus stationnaire régulier (de rang maxi- 
mal dans le cas vectoriel), fe(2), /,(4) les densités spectrales des processus 
E(t) et s(r) respectivement, /,:(2) la densité spectrale mutuelle et g(À) = 
= fe(A)f#"(Q). Supposons que $,(2) désigne la meilleure estimation en 
moyenne quadratique du signal s(1+ 7) sur le vu du processus E(u), u = t. 
Si r = 0, on a affaire à une filtration avec prédiction, si r — 0, à une filtra- 
tion avec retard. Les théorèmes 7 et 8 décrivent des filtres optimaux dans 
le cas d’un retard aussi grand que l’on veut. 

Théorème 9. La caractéristique fréquentielle H,(i2) d'un filtre optimal 
pour l'estimation du signal s(t+7) d'après les observations de E(u), u <t, 
est de la forme 
D a(s it) ep l(e7 4) (t discret) ; 
s=0 


LACDER — (10.19) 
ec Ata(s tr) as] PT")  ( continn), 
0 


où per”, g{iÀ) sont les composantes de factorisation de la densité spectrale 
Je(2) ; 


RE Î 4 g()g (ec) d (discret) : 
a(s) — ee 
_ | | cg(2)p (2) dÀ  (t conti). 


Donc, si £(1) -- [ e‘4 dêt2) est la représentation spectrale du processus 


A 
(Ë(:), ET}, alors 


Se) = [es (i2) dé Q). (10.20) 
A 


11.11. Processus aléatoire stationnaire 
au sens strict 


11.11.1, Définition. Soient {£ (1), 1 € T }un processus aléatoire à valeurs dans 
l'espace {X, B}, où X est un cspace métrique, %Ÿ la tribu des boréliens de 
X, T un ensemble de la forme {0, +1, +2, ...}, (0, 1, 2, ...} (1 discret) 
OU ]— ©, co[,[0, cl (/ continu). 

Définition 1. On dit qu'un processus {Ë(1), 1 € T'} est stationnaire au 
sens strict, si pour tous #,6€7,k=1,...,n,nz 1, tels que 1,4/€T, 
la loi conjointe dans {X", Y"} des variables aléatoires {£(7, +1), EC: +1), 
..&(4, +1} ne dépend pas de t. 

En d’autres termes, un processus est stationnaire au sens strict si ses 
lois finidimensionnelles sont invariables par des translations temporelles 
admissibles #,+4€T,k=1,...,n. 

La définition ! équivaut à la suivante : on dit qu'un processus 
(5), 1€ T}cest stationnaire au sens strict, si pour une fonction f(\,, ve, ... 
..., 4), XXE X, Y'-mesurable quelconque l'espérance mathématique 
ES (EG, +0), Ets+0), ….., Er, +41)) ne dépend pas de s quels que soient 
t1,k=1,...,n,n= 1,telsquet,+1€T. 

Si t est continu (T = ]- >, œ[, ou T = [0, [), on suppose généra- 
lement que le processus {(1), 1€ T} cst stochastiquement continu : 
lin P {d(£(e), É(s)) > €} = 0 pour tout € > 0, où d(...) est la distance dans 
9 


l'espace X. 

En général, les processus stationnaires au sens large ne lc sont pas au 
sens strict. Par ailleurs, un processus stationnaire au sens strict ne possède 
pas forcément une espérance mathématique finie et un moment d'ordre 2. 
Si l'espérance mathématique et le moment d'ordre 2 d'un processus station- 
ee au sens strict sont finis, alors ce processus cest stationnaire au sens 
arge. 


11.11.2, Exemples 1. Soient T = {0, +1, +2, ...} ou 7 = {0, 1,2, ...}ct 
{£(),1 € T} unc suite de variables aléatoires indépendantes identiquement 
réparties. Le processus {£(r), 1 € T} est une suite aléatoire stationnaire au 
sens strict. 

2. Soient {5(1), 1€ T'} une suite stationnaire définie dans l'exemple 1, 
a, 4CT, une suile de nombres réels ou complexes tels que la séric 


ÿ a, SC ts), s11CT, converge stochastiquement (ct par suite presque 
ser 


sûrement, puisque Ë(s) cest indépendant). Le processus {7(+), 1€ T}, où 
7) = ÿ a,£(t4:5), cest une suite aléatoire stationnaire au sens strict. 
sCT 


€ 
3. Soient T = {0, 1,2, ...} ou T = [0, cf et {£(r), 1 € T} un processus 
markovien à valeurs dans {X, 8}, où X est un espace métrique compact, 
possédant unc loi stationnaire unique o( -) (une mesure invariante). 
Si la loi de #(0) est confondue avec o( :}), alors {Ë(r), ET} est un 
processus aléatoire stationnaire au sens strict. 


268 


4. Soit {n(t), ET}, T = [0, {, un processus homogène 4 accroisse- 
ments indépendants. Si /'(u, x) est une fonction continue telle que 


f EI /(u, mu))l du < oo, 


alors le processus 


{Ë(),1ET}, où EQ)= [ JG nG+0)-n()) du, 


cst stationnaire au sens strict. 
5. Un processus stationnaire gaussien au sens large est stationnaire 


au sens strict. 

6. Soit {Ë(r), 1 € T} une suite de vecteurs aléatoires stationnaire simul- 
tanément au sens strict et large. 

Le processus {r, (1), 1 € T}, où ,(t) = EG (1+h), 1+h ET et h fixe, 
est une suite stationnaire au sens strict de matrices aléatoires. 


11.11.3. Applications préservant la mesure. Soit {£(1), € T} un processus 
aléatoire stationnaire au sens strict à valeurs dans {X, 8}. Désignons par 
XT l'espace des suites x = {...,xX_1,Xo, X1, .. . } Si t est discret ou l'espace 
des fonctions x(#), / € ]— ©, œf, si T est continu ; par ©, la plus petite 
tribu de X7 contenant les ensembles cylindriques et soit P£ la mesure 
induite sur L par le processus {£(r), 1 € T}, définie sur les ensembles cy- 
lindriques de £ par l'égalité : 
Pere ZT: x) € 41, ..., x(,) € À,} = 
= P{É£(:+/)EA,,...,Ë(t2+h)€ 4,}, 
pourtous 4. EB,nET,k=1,...,nn= 1,où h = OsiT = {0 El E2:2:) 
ou T = ]-c, of et 1+h2=0,k=1,...,n, si T = {0,1,2,...}, ou 
T = [0, cf. 
L'espace {X7, ©, Pe} s'appelle représentation du processus {£(1), 1 € T}. 
Pour tout 10, 1€ T, définissons l'application de l’espace X7 dans 


lui-même, appelée translation du temps S,, par l'égalité Vxe X7, x, = 
= 9,x, Où x,(s) = x (1 +5). On a l'égalité 


SS,= Sig So= li, (11.1) 


où Zest l'application identique. 
La condition de stationnarité du processus {£(1), : € T} veut dire que 
pour tout ensemble cylindrique C € £ 


Pe(C) = Pe(S,C). 


Définition 2. Soient {%, , “} un espace mesuré, S une application 
mesurable de {%/, %} dans {%, 3}. On dit que S préserve la mesure (est un 
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cadomorphisme) si pour tout 4€ % 
p(ST 141) — pr(A), (11.2) 


où S714 est la contre-image complète de l'ensemble 4 par l'application S. 
On dit qu'une application S cest inversible si existe une application 
mesurable S”! telle que SS-1 — S-IS = J. | 
L'application S”! est dite inverse ou réciproque de S. 
Appliquée aux processus aléatoires, la définition 2 signifie qu'un 


processus {£(1), 2€ T} est stationnaire si l'opérateur de translation du 
temps $, dans Æ7 préserve la mesure Pe. 

Soit {9, G, P} l'espace probabilisé fondamental sur lequel est défini 
le processus {£ (1), € T}. En associant à chaque w € 9 la trajectoire £( - , w) 
du processus {£(1) = £(r, w), 1 € T}, on peut définir une application mesu- 
rable Te de l'espace {Q, ©} dans l'espace {X7, ©}. 

Si Te l'est une application de {£”, £} dans (9, G} dont le domaine 
de définition est domaine des valeurs de l'application 7e, alors l'application 
S, de l'espace *? induit une application bijective $, de l'espace À à l'aide 
de la formule 


$,= Tr 1S,Te. (11.3) 


L'application $, préserve la mesure P. À son tour, l’application $, 
engendre une application des variables aléatoires à valeurs dans {X, 8} : 
pour toute variable aléatoire £(«w) € X 


LS, £] () = (ST 0). (11.4) 


Tout processus stationnaire au sens strict peut être représenté sous la 
forme 


E(r) = $,£ (0). (11.5) 
En particulier, si le temps ? du processus & (1) est discret, alors 


£() = S,E(O), (11.6) 
où $— $,. 


11.11.4. Théorèmes ergodiques. La théorie des processus aléatoires au 
sens strict peut ètre considérée, dans sa partie qui utilise essentiellement 
l'opérateur de translation, comme un cas particulier de la théorie ergodique 
des applications préservant la mesure (endomorphismes) d’un espace mesuré 
dans lui-même. 


L'une des plus importantes propriétés des processus aléatoires station- 
naires au sens strict {£(1),”1 € T}est l'existence de la limite des moyennes 
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temporelles 
1-1 


nt (4) = + D 86) T={0,+1,+2,...} ou 
T={0,1,2,...): 


. » 4) T= (0, +1, +2, ...); 


21+1 


n£ (e) = 
(11.7 
= féds, T=]-c,c[ ou T=1[0, 1; 
0 


( 
(= 2 f Eds, T = ]- co, 
1 


pour / ->00, 
Désignons par G'cS et ©Gt'cS les tribus engendrées par les 
variables aléatoires £(s) pour sætets>1,s<=-—1,12 0 respectivement 


ct soient 
> = MN GS, Gi = MN St, 
ET (Er 


Théorème de Birkhoff-Khintchine. Si {£(1), 1 € T'} est un processus aléa- 
toire stationnaire au sens strict tel que Ed(Ë(0), 0) <<, alors existent 
presque sûrement les limites 


lim nt) = 1* ; 
{ —+ co 


(11.8) 
lim £(1) = n*, 
t— 0 
et de plus EOYE 
nt = E[S(0)/C®)]; 
11.9 
+ = E[£(0)/E+=] | D 
En = Eéë(0) ; 
Ent = EË(O). | (11.10) 


On dit qu'un événement 4A€G est invariant par une application 
$, ($;-invariant) si 
P{$71(4)44} = 0, 


où A est le symbole de la différence symétrique des ensembles. 


La classe de tous les ensembles $,-invariants forme une tribu Œ+ ou 
Gi Ve Vo correspond au cas où 7 = ]- co, of ou T = {0, +1, 
+2, ...}). 
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On dit qu'une application $,est métriquement transitive si tout ensemble 
$,-invariant est de probabilité 0 ou 1. 

Il est évident que si $, est une application métriquement transitive, 
on : le signe d'égalité dans les conditions du théorème de Birkhoff-Khin- 
(chine, soit 


n* = EË(0) ; 
n+ = EË(O). 


On dit qu'un processus {£(r), s € T} stationnaire au sens strict est 
ergodique si la tribu S® est triviale, c'est-à-dire ne contient que des événe- 
ments de probabilité O ou 1. 


Théorème 1. Pour qu'un processus stationnaire {E(r), 1€ T} soit ergo- 
dique, il est nécessaire et suffisant que soit réalisée l'une des deux conditions 
suivantes : 


1) l'application $, est métriquement transitive : 


2) pour toute fonction f(x) B-mesurable telle que E|f(Ë(0))| <<, 
la fonction 


_ 1 ver . 
lim 2 f($*E(0))  G discret) ; 


= (11.11) 
lim _- [ J(S.5(0)) du (& contimo) 
En n 


est presque sûrement constante. 


Une conséquence immédiate du théorème de Birkhoff-Khintchine est le 
Théorème 2. (Loi forte des grands nombres pour processus stativnnaires 
au sens strict). 


Si{Ë(), 1€ T}est un processus aléatoire ergodique stationnaire au sens 
strict telque Ed (Ë (O), 0) < co, alors on a presque sitrement 


lim »*(1) = EË(0) ; 


1— > 


lim »£(1) = Eé(0O). 


1— © 


11.11.5. Exemples de processus ergodiques. !. La suite de variables aléatoires 
indépendantes identiquement réparties {£(r), : € T} telle que El (0)1 << 
est une suite ergodique. 
2. Soit {£(1), 1 € T'} un processus gaussien stationnaire de fonction de 
corrélation B(t). Si lim B(r)= 0, alors {£(r), 1€ T} est un processus 
i— 


crgodique. 
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3. Soit ? = {1,2,...,n}, {$(4),1€T}, T = {0,1,2, ...} une chaine de 
Markov à valeurs dans X et de matrice de probabilités de passage 


0 1 0 

0 O 1 (4) 
Ps es ses 

0 O0 0... 

1 O0 0...0 


(chaine de Markov cyclique). 
Si la loi de £(0) est de la forme P {£ (0) = k} = _ ,alors{Ë(r),1€T} 


est une suite stationnaire ergodique. 

Si le processus L (4), € T} est ergodique, le processus {n(r), # € T}, où 
ne) = f(ËG+0), ÉGte+e), ..., ECHO) 4 URET, k=1,...,nn> 
et SX, Xe, -.., X,) est une fonction #"-mesurable arbitraire, est aussi 
ergodique. 

Si, en particulier, {£(1), 1€ T} est une suite de variables aléatoires 
indépendantes identiquement réparties T = Le 1, 2, ...}et f @) = 4a(X) 


cst l'indicateur de l'ensemble 4 € 3, alors + "x 44 & (s))= =— 


fréquence de l'événement £(s) € A. D'après le théorème 2, on à presque 
sûrement 

lim Ya (A) 
n 


A — 0 


= E7,(£(0)) = P{£(0) € 4}. 
Cette proposition est connue sous le nom de théorème de Borel (cf. chap. 2). 


11,11.6. Brassage. Supposons que £, sont les moyennes temporelles du 
numéro précédent. On dit qu'un processus {£ (1), ? € T} stationnaire (multi- 
dimensionnel) est justiciable du théorème limite Ai si existent les limites 


lim Es£,Ës = 


#5 — © 


pour T = [0, œ{ ou 7 = {0,1,2,...} ou 
lim E2sé,É* = 


pour T = ]-c,œ[ où T = (0, H1,-E2,...} ct si 
lim F24,(x) = (x), 


1 


où 


LT D Eva vai T=[0,{[ ou T={0,1,2,...}: 


P{V25Éé,<x}, T=]-c,c,[ où T={0,+1,+2,...) 
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(dans le cas d'un processus multidimensionnel l'inégalité est comprise 
élément par élément), D(x) est la fonction de répartition de la loi normale 
(multidimensionnelle) de moyenne nulle ct de variance (matrice des cova- 


riances) C. La présence des moyennes temporelles dans Fi, (x) suppose 


l'ergodicité des processus justiciables du théorème limite central. Cependant, 
même si tous les moments indispensables existent, il faut imposer ici des 
conditions subsidiaires plus fortes que l’ergodicité. 

L'exemple 3 du paragraphe précédent (chaîne de Markov cyclique) 
nous fournit un exemple élémentaire et assez suggestif de processus station- 
naire ergodique possédant tous ses moments sans être pour autant justicia- 
ble du théorème limite central. La cause étant l’indépendance des termes 


de la somme : 
V'sé, = un D ë(+). 


st-0 


Soient CG! et 3%,, 7 :- 0, les tribus engendrées par le processus 
E(r): Es = ufË(s), s<1}, Gr = ofË(s), sæt+r). ©, est inter- 
prétée comme le passé, S?,, comme le futur du processus £&(t). L'applica- 
bilité du théorème limite central aux processus stationnaires est essentielle- 
ment liée à la réalisation des conditions assurant une diminution de l’indé- 
pendance du passé ©! par rapport au futur © lorsque r croît. Voici une 
de ces conditions. 

Définition. La condition 


a(r)= sup |P(4H)-P(4)P(B)1->0 
A6 6! 
1ESF 


pour 7 -» s'appelle conditiun de brassage fort. 

La fonction «(r) s'appelle coefficient de brassage (fort). 

Les processus vérifiant la condition de brassage fort sont ergodiques, 
car la condition d'ergodicité peut être décrite sous forme de limites de 
Cesaro : 


I | 
: a(r, A4, H) 0 pour s-°œ (t discret); 
S 11 


Li 
fat, A,B)dt 0 pour «>: (4 continu) 
” o 


pour tous 4€ S'., BE Gi} r où a(r, 4, B) — P(4B)-P (4) P (B). 

Il existe des critères trés efficaces de vérification de la condition de 
brassage fort pour les processus gaussiens. 

Soient & (#) un processus stationnaire gaussien, H!.. et H,%, les espaces 
hilbertiens engendrés respectivement par les variables aléatoires £(s) pour 
s<tcts=t+r respectivement. 
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o(r)= sup Eëér. 
ea 
7€ Hjtr 


Théorème de Kolmogorov-Rosanov. Pour les processus stationnaires 
gaussiens 
a(r)=o(r) <27a(r). 


Pour que la condition de brassage fort soit réalisée pour des suites 
gaussiennes stationnaires, il suffit que la densité spectrale / (4) soit con- 
tinue et positive, c'est-à-dire que (À) >= C = 0. 


11.11.7. Théorème limite central. Soient & ({) un processus aléatoire (multi- 
dimensionnel) stationnaire au sens strict, &, ses moyennes temporelles. 

Théorème 3. Si le processus E(t) vérifie la condition de brassage fort et 
admet une densité spectrale continue bornée f (À), et, de plus, det f (0) # 0 
{dans le cas d'un processus multidimensionnel), alors pour qu'il soit justiciable 
du théorème limite central, il est nécessaire et suffisant que soit réalisée la 
condition suivante : 

pour tout & > 0 il existe des nombres Ne et T. tels que 


[ IxFaiaQ=<e 


Izll > Ve 


pour s > Ts. Ceci étant, la variance (matrice des covariances) de la loi 
normale limite est C = 27 f(0). 

Il existe des conditions suffisantes d’applicabilité du théorème limite 
central de vérification plus aisée, liées soit à des conditions subsidiaires 
sur la tendance du coefficient de brassage « (r) vers 0, soit à des conditions 
encore plus strictes que la condition de brassage fort. 

Théorème 4. Si : 1) le processus E(t) vérifie la condition de brassage 
fort, et de plus 

: a(r) — O(r""+09) 


et EilË()I+* <o pour des e > 0, o>+ et 


2) la densité spectrale f (À) du processus est bornée, continue et det / (0) > 
< 0 (dans le cas d’un processus multidimensionnel), alors le processus 
Et) est justiciable du théorème limite central. En outre, la variance (matrice 
des cuvariances) de la loi normale limite est C = 2x /f(0). 
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Chapitre 12 
CHAMPS ALÉATOIRES 


12,1. Définitions fondamentales 


12.1.1. Définition d’un champ uléatuire. Lois finidimensionnelles., On appelle 
champ aléatoire une fonction aléatoire de plusieurs variables réelles. 
Donnons unc définition plus exacte. Soient (9, &, P) un espace probabilisé, 
D un ensemble dans R". La fonction £(w, x, ..., x.) = £(w, Ÿ) définie 
pour &w € €, (v1, ..., x.) = #€ D, s'appelle champ aléatoire défini sur 
l'ensemble D, si elle est "E-mesurable par rapport à & Pour Xp, ..., Xe 
fixes. Ie champ est scalaire si le domaine de valeurs de la fonction aléa- 
toire (wo, x, ..., x.) est R!, et vectoriel si D est R*. Le cas le plus naturel 
de champ aléatoire est le champ défini sur D 'X[0, T}, où D est un domaine 
d'un espace de dimension 3, l'intervalle [0, 7], un intervalle temporel. 
Ces champs permettent de décrire l’évolution aléatoire de milieux continus 
(par exemple, la répartition de la chaleur si la conductibilité thermique et 
les sources de chaleur sont aléatoires, la filtration dans un milieu aléatoire, 
etc.). Les fonctions £(e, x,, ...,x,) à w fixes sont appelées réalisations ou 
fonctiuns échantillunnées du champ aléatoire. 

Les lois finidimensionnelles du champ aléatoire £(e, X)(X € D € R") 
sont de la forme 


& 
Fa re (4, .. A,,) = en CZ *!) € de: 
J--t 
FLE Yi € D, k = 1,2, 


A , A, sont des ensembles boréliens appartenant au domaine des 


Valeurs de (: -)). 
Pour & fixe, on obtient les lois k-dimensionnelles du champ aléatoire. 


Les lois finidimensionnelles d’un champ aléatoire vérifient les con- 
ditions de compatibilité : 
I. Pour toute permutation £,, ..., des nombres 1, ..., À 
Fe. (du ui À,) = Fa Au es A) 
11. Pour tout 4 
Fans ces Ai À) = Fu m-(Au .., 455) 
(R" est le domaine de valeurs de la fonction &(-)). 
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Le théorème de Kolmogorov (cf. nunéro 9.1) affirme que pour toute 
famille compatible de lois finidimensionnelles il existe un champ aléatoire 
Ë(o, *) possédant cette famille pour lois finidimensionnelles. 


12.1.2. L'onctions moments. Considérons un champ aléatoire à valeurs 
numériques £(w, *). La fonction 


me, À) = El(o, &!) .……. &(o, x) 


(si elle est définie pour € D, i = 1, ..., k) s'appelle fonction moment 
d'ordre £ du champ aléatoire £(w, *). 
La fonction moment d'ordre 1 


m(*) = Elo, à) — au(x) 
s'appelle valeur moyenne du champ aléatoire, La fonction 
(Xt, .., À) = E{(é(e, &1)— ax) .….. (Go, #)— a) 


s'appelle fonction moment centrée d’ordre 4 du champ aléatoire £(w, X). 
La fonction moment centrée d'ordre 2? est la fonction de corrélation du 
champ aléatoire : 


B(X, ÿ) = E£(e, à) So, ÿ) — Elo, *) E(o, }). 
Soient Eos, *) un champ aléatoire à valeurs dans À", Ho, X) = 
= (£,(o, X), ..., &,(w, X)). La fonction vectorielle 


d(X) (a), ..., 4,09) — (EË Co, x), ..., Eëtos, X)) 


s'appelle valcur moyenne du champ aléatoire vectoriel. La fonction Z{(X, ÿ) 
définie sur DX D ct prenant des valeurs matricielles et pour laquelle les 
éléments de la matrice B(Y, ÿ) sont définis par les égalités 


bjr, ÿ) = Eë{(X) 6) — ax) a{ÿ), 


s'appelle fonction matricielle de corrélation du champ aléatoire vectoriel. 
Les fonctions moments d'ordre supérieur du champ vectoriel sont définies 
par 
FC DES La E Set 7 ET 
ne Vie eee Ne) = ES M) ee ST) 
où #1, = (m9, ..., mn), ET 2 EEE, Er, Cependant ces fonctions 
sont rarement utilisées. 


12.1.3. Représentation des champs de vecteurs par des séries orthogonales. 
Soient D un ensemble borné, £(*) un champ aléatoire numérique dont la 
fonction de corrélation B(X, ÿ) existe ct 


(| B(X, À) di = © 
D 
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(l'intégration a lieu par rapport à la mesure de Lebesguc). II existe alors 
une suite orthogonale complète de fonctions g,(*) sur D qui sont les fonc- 
tions propres de l'opérateur intégral de noyau B{(X, }) 


Ari) = [ BG, D) rD) dy, 


À, étant non négatifs et Ÿ° 2, < co. 
Le champ aléatoire E(*) se représente par la série 


E(&) = a) +2 TX), (1.1) 


où 7: Cst une suite de variables aléatoires non corrélées, En, == 0, 
Var % = À. La série (1.1) est convergente au sens suivant : 
2 


N 

lim [ED -a- Y mnt] dé = 0. 

+ ph k..1 

Les variables aléatoires », sont définies à partir des relations 
me = [ EC) qa() dé. 


Un résultat analogue est valable pour les champs aléatoires vectoriels. 


Supposons que le champ E(&) possède une fonction matricielle corrélative 
BC, ÿ) = BG, PJ, telle que 


LE bECE, 2) di < «>. 
D 


Il existe alors une suite À, 0 pour laquelle le système d'équations inté- 
grales 
Ag) = À [hu, PP) dj, = 1,...,n, (1.2) 

admet une solution pour À = 2,. Si pour À = }, 

PR) = (TI), .….., 72), 
cst unc solution du système (1.2) telle que 

JE IE dE :: 1, 
(=1 

alors 

EG) = 4) + L mp), (1.3) 
où 7, est une suite de variables aléatoires non corrélées pour lesquelles 
Es = 0, Var 7, = /,. Dans (1.3) la convergence est en coordonnées comme 
dans (1.1). 
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Excmple 1. Champs aléatoires gaussiens,. On dit qu’un champ 
É(*) est gaussien si pour tous ÿ,, ..., Ë € D la loi conjointe des variables 
ER), ..., Ë(&) cest gaussienne. De façon analogue, un champ de vecteurs 


E(X) est gaussien si la loi conjointe des variables £,(&,), ..., E(#,), ... 
.. ECG), .., &,(6) est gaussienne. Les lois finidimensionnelles des 


champs gaussiens £(*) sont entièrement définies par les fonctions ax) et 
B(X, ÿ). La fonction à(*) peut être arbitraire, la fonction matricielle corré- 
lative doit être définie positive : quels que soient %,, ..., 4€ D ct les 
nombres complexes x!, ...,"%, ...,a}, ...,a?, on doit avoir 


+ NE) 
D byti, Naf >> 0 
Ja! 


(& est le conjugé complexe de a). 

Exemple 2. Champs à accroissements indépendants. Soit £(*) un 
champ aléatoire défini sur R* :.{X: 1,:-0, i= 1, ..., m}. Pour le 
rectangle 171: {ÿ:a=x;=0b,i= 1,...,m)}posons 


A FC = A0 (2) te) (& 
: TL (X) =. 4 NA EH °°°" he. NU (), 
où De ENG See Bin es RS PO NE RC Neiteeve 


sus). | 

Le champ £&(*) est dit champ à accroissements indépendants si les 
variables ATRC2) ne 1 sont indépendantes quel que soit W, 
1, ..., 114 étant disjoints. Si £(Ÿ) =: 0 sur la frontière de R%, alors il 
admet unc loi définie par la fonction caractéristique 


a msn LS ièz \1+z 
Et 2 exp fan à [ (e%-1- Es): GG de}, Q4 


où G(-, dz) est la mesure sur RFYX]-00, œ[; 11; {#0 < x, « a, 
i-- 1, 2) pour &C RT (lintégrant de (1.4) est supposé égal à Fe 
pour 2 -. 0). En particulier, un champ gaussien à accroissements indé- 
pendants admet sous ces conditions la fonction caractéristique 


RTE À° 
© À: 7 , 1 Ü = - 
Le xp {ours 2 UP}: (1.5) 


où «4 X) est une fonction, pe, la mesure sur R*?,. 


12.2. Propriétés des réalisations 


12.2.1. Champs aléatoires mesurables. Intégration. Le champ aléatoire 
£(*) de lois finidimensionnelles données du théorème de Kolmogorov (voir 
résultat analoguc pour des processus aléatoires dans le numéro 9.1) admet 
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pour réalisations toutes les fonctions définies sur D. Une question intéres- 
sante est de savoir sous quelle condition existe un champ aléatoire à lois 
finidimensionnelles données dont les réalisations appartiennent à une 
certaine classe (sont mesurables, continues, dérivables, etc.). 

On dira que deux champs aléatoires £(%) et r{X) définis sur un même 
ensemble D € R" sont stochastiquement équivalents si 


P{E(X) = mMo}= 1, VXED. 


Soit D un ensemble (borélien) mesurable. On dit qu'un champ aléatoire 
E(w, Ÿ) est mesurable si la fonction E(o, *) est GXE"-mesurable, où S 
est une tribu dans l'espace probabilisé, €" la tribu des boréliens de R". 

Un champ aléatoire E(X) est stochastiquement continu en un point Xo € D 
si VE 

lim P{IË(X)—HNo)l > €} = 0. 


4 + fe 


Théorème 1. Soient D un ensemble mesurable, E(X) un champ aléatoire 
stochastiquement continu sur D. Il existe alors un champ aléatoire mesurable 
&’(®) stochastiquemtent équivalent à E(?). 

Soit {(dx) une mesure définie sur les boréliens de D. Pour le champ 
mesurable £’(*) on peut étudier le problème de l'existence de l'intégrale 


[ C0 a(dà). 


D 


L'ensemble des « tels que cette intégrale est définie (ecstadir 


l'ensemble des «w tels que [1£(x)1 (4) =) est Z-mesurable, de 


p 
méme que la valeur de cette intégrale. Le champ est intégrable par rapport 
à la mesure y si 


rl RÉCITCOE =| = 1. 
D 


Une condition suffisante d’intégrabilité du champ par rapport à la mesure 


uest 
JE IS) aGdù) < ce. (2.1) 
D 


Si (2.1) est remplie, alors (d’après le théorème de Fubini) 
E fr n(dX) = f E£"(?) H(d?). (2.2) 
D D 


Si &’(x) est un champ aléatoire gaussien ct [EX 6) (dx) est définie, alors 
D 
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cette intégrale est aussi une variable aléatoire gaussicnne. De plus, 
E JE (R) Ad) = [ at) u(d2), 
? É (2.3) 


Var | [+ Ti] = [BC ÿ) ad) a(d5), 
D D D 
où a?) ct B(%, ÿ) sont respectivement la valeur moyenne et la fonction de 
corrélation de £’(*). On remarquera que la formule (2.3) est valable pour 
tous les champs pour lesquels est réalisée (2.1) et est convergente (absolu- 
ment) l'intégrale de droite dans (2.3). 


12.2.2. Champ aléatoire séparable. On dit qu'un champ E(X) est séparable 
par rapport à un ensemble À © D si À est dénombrable et dense dans D 
et si existe un ensemble l'E & tel que P(L”) = 1 et pour toute boule S € R" 


Le sup £(*) = sup sc} car; 
ZEANS 2cpNns 


Lo : inf ë(N)= inf st} c £\' 
2EANS 3EeDNs 

Théorème 2. Tout champ aléatoire ËE(X) admet un champ séparable 
E’(À) qui lui est stochastiquement équivalent. 

Comme pour les processus aléatoires, la notion de séparabilité est 
d'un usage commode dans l'étude des propriétés des réalisations du champ 
aléatoire £(X). Supposons que D est compact. Pour que le champ aléatoire 
£() soit presque sûrement continu (c'est-à-dire pour que presque toutes ses 
réalisations soient continues ), il est nécessaire et suffisant que soient réalisées 
les conditions : 

1) £(&) est séparable par rapport à un ensemble À © D ; 

2) E(R) est presque sûrement uniformément continu sur A. 

Théorème de Tchentsoy. Ce théorème est une généralisation du théo- 
rème de Kolmogorov de continuité d'un processus aléatoire aux champs 
aléatoires. Soit donné un champ aléatoire séparable sur le rectangle II: = 
= {(f: 0=<x<a,i=1,...,m}. Si ce champ est continu sur les côtés 
1,= NX: x; = a} et si existent « + 0, f—0 et y > 0, tels que 
pour tout rectangle II € II; 


El ln < yl4(1)) +8 


(:1,, est défini dans 12.1, y est la mesure de Lebesgue dans R”"), alors le 
champ E() est presque sûrement continu. 


12.2.3. Continuité des champs gaussiens. Pour les champs aléatoires gaus- 
siens on peut obtenir des conditions de continuité au moyen de la fonction 
de corrélation. 
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Soient É(X) un champ aléatoire gaussien Sur un compact D, (x) sa 
valeur moyenne, B(X, ÿ) sa fonction de corrélation. Supposons que : a) EC) 
est séparable ; b) &X) est une fonction continue : c) existent des constantes 


y et Ô > 0 telles que pour p(X, Ÿo) < _ (o est la distance dans R”) 


(te) 


. = 2 RC _ 1 ue 
BOX, No) FBCK, X) - 2HCX, No) 7 5 [in DCE, = 


Alors le champ gaussien E(*) est presque sûrement continu. 


12.2.4, Dérivabilité des champs aléatoires. Un champ &(*) est dérivable 
(en moyenne quadratique) en un point à, si existent des variables aléatoires 


D : 


telles que 


1 = 0 
. no A x RAA ; Y -- EX, en Ê(Y 1x ; 


.,e Ô . ? € . Q 
les quantités À. E(X,) étant définies comme les limites en moyenne 
Ne 


quadratique 
AN: (Xo) 
4 AA 


lim N 


où /LÈCX) = Er, Xe Fan Ne) CN cs Nas cos Nude Pour 
que Ë(£) soit dérivable, il suflit que le soient les fonctions a(*) et ZX, ÿ) 


(par rapport à chaque variable). Si les dérivées partielles x.) (qui 
vk 


sont aussi des champs aléatoires) sont presque sûrement continues, alors 
les réalisations du champ aléatoire £(*) seront des fonctions dérivables 
par rapport à Ÿ pour presque tous les w. On définit de façon analogue la 
dérivabilité multiple d’un champ aléatoire. Une condition suffisante pour 
que le champ aléatoire £(*) soit & fois dérivable par rapport à * est que la 
fonction a) et la fonction B(*, ÿ) le soient 4 fois par rapport à chaque 
variable. 


12.3. Champs aléatoires homogènes 


12.3.1. Définition d’un champ homogène. On dit qu'un champ aléatoire 
EX) défini sur D < R" est homogène si : 1) D est un semi-groupe pour 
l'addition, i.e. Ÿ € D, ÿE D + $+ÿE D ; 2) EË(X) est constante, E{(X) #5) 
dépend seulement de ÿ-—ÿ. Les champs les plus souvent utilisés sont ceux 
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pour lesquels D est le groupe de tous les points entiers de R“ et D — R". 
Les premiers seront appelés champs à argument discret. On définit de façon 
analogue les champs aléatoires de vecteurs. 


12,3.2, Champs numériques à argument discret. Soit £(ÿ) un tel champ. 
Comme E£(*) = a, où a est une constante, on peut considérer le champ 
£'(R) = E(#) — a. Ce champ est également homogène. Donc, sans restreindre 
la généralité, on peut admettre que la valeur moyenne du champ est nulle. 
La fonction de corrélation B(*, ÿ) du champ est de la forme B(&- j), où 
B(£) est une fonction définie sur D et vérifiant la condition de définition 
positive : 


ÿ BG 2} == 0, (3.1) 
k, j=i 
quels que soient n, Z,, ..., 2, € D et les nombres complexes &,, ..., a, 


(&, est le conjugué complexe de «). La condition (3.1) nous donne la re- 
présentation spectrale suivante pour (2) : 


ñn ñn 
' (m) H ‘ S skÀs 
B(ë) = ] re | et"1  F(di), (3.2) 
-n 7 
où F(dÂ) est une mesure finie sur le rectangle 
[—-a,nf" -{Â: -r<À<7, j=1,...,m). 


F(d1) s'appelle mesure spectrale du champ aléatoire. Si cette mesure est 
absolument continue par rapport à la mesure de Lebesgue sur [—x,7[* et 


F(C)= | fU) dÂ 
C4 


(J est la densité de F (dÂ) par rapport à la mesure de Lebesguc), alors f (1) 
s'appelle densité spectrale du champ aléatoire. Dans ce cas, (3.2) s'écrit 


71 ‘1 
m 
8 2, sad 


B(Z) — J et"1  f(1) di. (3.3) 


— 1 ei L | 


La densité spectrale peut, sous certaines conditions, être exprimée au 
moyen de la fonction de corrélation : 


; — S sxÀ 
D = on" Le 1" "8@) (3.4) 
36€D 


(s série de droite converge cn moyenne quadratique et l'égalité (3.4) 
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1 el 
a lieu si Of... f/#A)d{<c, ou, ce qui revient au même, 
nd L | -71 


Y BYZ) = © |. 
262 

Il existe une mesure aléatoire à valeurs complexes et orthogonales 
w(dÂ) sur [— x, af" pour laquelle 


Ey(A) y(B) = F'(AT1B), 


et telle que pour le champ aléatoire £(Ÿ) l'on ait la représentation 


E(Ÿ) = La (| exp £ > as] (di). (3.5) 


—1 


Loi des grands nombres pour un champ aléatoire, Soit E(X) un champ 
homogène dans R" tel que EË(X) = 0. Il existe alors la limite en moyenne 


quadratique : 
I CU 
lin À- ——— t(), (3.6) 
Nr (% | ] a 


égale à y({0}), où {0} est l'ensemble de R* composé du point 0. Pour que la 
limite (3.6) soit presque sûrement égale à O, il est nécessaire et suffisant que 
E |y({0)I° = F({0}) = 0. Ceci aura lieu si 


. . m sin ) - 
lim lim —} A(2) = O0. 3.7 
ô | 0 N Es œ le #2 OR M (ü ZE ) ) 


12.3.3. Champs de vecteurs à argument discret. Soient £(%) un champ 
homogène défini sur un réseau à valeurs entières dans R°, à valeurs dans R!, 
EUR), ..., E'(X) ses composantes. On admettra que EF&'($) = 0. Posons 


E&'(X) 505) = byE — 5) 


ct désignons la matrice ||b4(#)1l = BC). Pour que la /X/-matrice 
B(?) soit fonction matricielle de corrélation d’un champ de vecteurs homo- 
gène à argument discret, il est nécessaire et suffisant que 


| l 
D2 Z bnté— jeta; t 2 0 (3.8) 


si P,4= 


quels que soient # et les nombres complexes «!, ..., #!, «!, ..., a! et les 
points Z,,...,2,€ D (condition de définition positive d’une fonction ma- 
tricielle). 

La fonction matricielle de corrélation admet la représentation spectrale 
suivante : il existe sur [—7, 7[" des mesures de signes variables F,(d?), 
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r,q= 1,...,/, telles que 


b{Z) = ! ail pi exp D sa] F,{d1), (3.9) 
la matrice 
1 FC) oem, 1 (3.10) 


étant définie non négative pour tout ensemble borélien À de [—:7, 7[". La 
matrice (3.10) s'appelle mesure matricielle spectrale du champ de vecteurs. 
Si les fonctions F,,(4) sont absolument continues par rapport à la mesure de 
Lebesgue sur [—7, 7[", c'est-à-dire 


FA) = Î /() di, (3.11) 
A 


alors la matrice || AU] p.e=1,.…,t S'appelle densité matricielle spectrale 
du champ de vecteurs. Elle est aussi définie non négative. 
Si la densité matricielle spectrale existe, la formule (3.9) s'écrit 


b,.(2) = | S n D exp D sa] 114) dÂ. (3.12) 


Si la densité matricielle spectrale existe, elle peut être définie par la formule 
suivante : 
4 Ë re 
LAC) = lim Qn)7" Le #1 8G)G-e)lt ll (3.13) 
e—+0 3CD 
Le champ de vecteurs aléatoire admet lui-même une représentation 


spectrale. 11 existe un ensemble de mesures stochastiques w,(4/) à valeurs 
complexes sur [—:7, 7{" vérifiant les conditions 


Ey,(4)=0;  Ey,(4) PB) — F,(AT1B) 
pour des boréliens À et B quelconques de { —x, 2{* et, de plus, 
7 7 pas 
Er(R) — [ ss f exp £ ÿ sal p,(dÀ). (3.14) 
_n Fe 1=1 


12.3.4. Champs numériques à argument continu. On gardera les mêmes 
notations que pour les champs numériques à argument discret. La condition 
de définition positive sera également de la forme (3.1), mais ici Z,, ..., 2, 
sont des points arbitraires de R". La fonction de corrélation admet la re- 
présentation spectrale 


B(2) = [... [exp LE na] F(d4), (3.15) 
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où F(4A) est une mesure finie sur A". Cette mesure est dite mesure spectrale. 
Si elle est absolument continue et sa densité par rapport à la mesure de 
Lebesgue est / (À), alors / (Â) est appelé densité spectrale. Toute fonction non 
négative intégrable sur R” peut être densité spectrale. La fonction de corré- 
lation correspondante est donnée par la formule 


B(Z) = I] re f exp { ÿ ha] (À) di. (3.16) 
&=1 


Dans le cas où la densité spectrale existe, elle s'exprime au moyen de la 
fonction de corrélation à l’aide de la formule 


SA) = Jim (| Lu (| exp ti Ë Az — 6 À 4] B(Z) dZ. (3.17) 
Le champ aléatoire admet également la représentation spectrale 
E(*) = I] is (| exp { ; na p(dÂ), (3.18) 


où y(dÂ) est une mesure stochastique à valeurs complexes sur R”, telle que 
Ey(4) = 0, Ey(4) y(B) = F(ANB) pour tous les boréliens À et B de R®. 
Loi des grands nombres. // existe la limite en moyenne quadratique 
r r 
lim 5) Î _ J E(2) dé = y({0}). (3.19) 
FT — © 2T 
-r 


-T 


Pour que cette limite soit presque sûrement nulle, il est nécessaire et suffisant 
que F({0}) = 0, cette dernière condition étant équivalente à 


Tr T 
lim lim J ne ( (I ea) HZ) di = 0. (3.20) 
0,0 FT + ee . 1 2 


12.3.5. Champs de vecteurs à argument continu. Supposons qu'un champ 
homogène é(X*) est défini sur R°, prend ses valeurs dans R!, £'(#), ..., £(&) 
sont ses composantes, Ef/(x) = 0, EËr(2) &t(ÿ) = b, (x — ÿ). 

Désignons par B(Z) = |1b,(Z)1l,,,=1,...,1 la fonction matricielle 
de corrélation de ce champ. La condition (3.8) est, comme dans le cas d’un 
argument discret, nécessaire et suffisante pour que la fonction continue 
B(Z) à valeurs matricielles soit fonction matricielle corrélative du champ 
E(R). Il existe des mesures F,,(dÂ) à signe alterné de variation bornée sur 
R"® telles que l’on ait la représentation spectrale 


biz) = [... [exp D sA] F, (47), (3.21) 
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la matrice |1/,,(4)11,,:1,...4 Étant définie non négative pour tout 
borélien À & R*. La mesure matricielle |1F,,(4Â)11,,,-1,...., s'appelle 
mesure spectrale matricielle du champ de vecteurs. Si cette mesure est ab- 
solument continue par rapport à la mesure de Lebesguc sur R”, alors la 


matrice 
IPC I PEN ssl 
des densités 
| F2) 
1\= 207 
70) dÂ 


s'appelle densité spectrale matricielle (cette fonction est une matrice définie 

non négative pour chaque /). La fonction matricielle || fe) ll, =, Li 
ut être densité spectrale si elle est hermitienne et non négative pour chaque 
et 


f... fImOIdf < pour p»,q::1,...,1. 


Le champ de vecteurs admet la représentation spectrale 
Er( À) == I] . [exp l ». el y, (dÀ), (3.22) 
Ent 


où y.(d1), ... , yi(dÂ) sont des mesures stochastiques à valeurs complexes 
sur À" telles que 


Ep, (4) (8) = F(ANB). 


12.3.6. Dérivation des champs homogènes. Etant donné que certaines 
composantes des champs de vecteurs sont des champs numériques, il sufMit 
d'étudier simplement la dérivabilité d’un tel champ. Soient £(*) un champ 
homogène numérique, F(d1), sa mesure spectrale. Pour qu'il existe la 


OX) 


dx au sens de la convergence en moyenne quadra- 
k 


tique, il est nécessaire et suffisant qu'il existe la dérivée continue D ) 


dérivée partielle 


ou que : 
PJ... JIM dFG@D - «. 


£ . 
2e sera également champ homogène de fonction 
VE 


O1B(X) 
Ox 
F(4) - [... [IF FO). 

4 


Sous ces conditions, 


et de mesure spectrale 


de corrélation — 
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On détermine par dérivation de la représentation spectrale (3.18) : 


ao = f. . | (i2,) exp {: È axe) p(d}). (3.23) 


Les conditions d'existence des dérivées partielles s'énoncent comme 
suit : pour que la dérivée 
0'E(X) 


= ——— — Gai= nm +... +n,) 
(0x,)""... (Ox,.)"" 


existe au sens de la convergence en moyenne quadratique et soit continue 
en moyenne quadratique, il est nécessaire et suffisant que soit réalisée l’une 
des conditions : 

O?B(X) 


(ôx,)" ... (0x .)""* 
b) J... 12%... Al F(d7) < co. 


a) il existe , et cette dérivée est continue ; 


O"É(X) 


Si ces conditions sont: réalisées, alors ———" sera égale- 
(0x)... (OX )"" 
ment champ homogène de fonction de corrélation 
œ"B(X) 
CNP ——— , 
(dv)... (0x) 
et de mesure spectrale 
(es) 
Fun = ff)". (A Fi). (3.24) 
(0) 


0 
(0x,)"'... (0x,)'* 


s'obtient par dérivation de (3.18) : 


0” NA: L JE © 
pro M Es M © Ve La 
(3.25) 


12.3.7, Opérateurs  différentiels à coefficients constants. Soit 
_. sx) Un opérateur différentiel à coefficients constants, où 
1 - 
Lys... A) est un polynôme de #,, ..., 1, de degré n. 
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Si un champ &(x) est tel qu'il existe des dérivées partielles jusqu’à l'ordre 
n compris, continues en moyenne quadratique, alors on peut lui appliquer 


L] e n Ô 
l'opérateur différentiel - DS a) Posons 
Lu Ô Ô 
(© = Lx . a) E(2). (3.26) 


Le champ r{.ÿ) sera également champ aléatoire homogène de fonction de 
corrélation 


BAD = If... Ju - +) B& (3.27 
ct de mesure spectrale 
F4) = | … FIL, ..., 14) F(d1). (3.28) 


Si £(%) admet la représentation spectrale (3.18), alors {?) sera de la 
forme 


MX) = (| L(i,, ..., i,) xp l > As y(dÀ). (3.29) 
=] 
Considérons l'équation différentielle 
Ô 0 ee. 
WE. .. x) E(2) = n(®), (3.30) 


où à) est un champ homogène. Supposons que m1) possède une mesure 
spectrale F,(d7), et que sa représentation spectrale est 


7(X) = f de [ exp { È sa pA(d?). 


Alors (3.30) admet une solution unique qui sera champ homogène si et 
seulement si 


Le far m0 <> 
Dans ce cas la solution de (3.30) s'écrit 
. 1 © 
ED) = Î …. I LD {r ao} vd), 630 


et la mesure spectrale F:(+) du champ £(x) sera 


F«4)= |. | TG 557 AG). (3.32 
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Soit £(£) un champ numérique de fonction corrélative B(X) et de mesure 
spectrale F4). La transformation intégrale générale est de la forme 


1) = [... [ XCG, ÿ) ÉO) dÿ, 
où X(?, ÿ) est une fonction telle que pour tous les x existe 
(| … fx, Da) KR, Da) BO: — Da) dÿ dÿs < ©. 
Si X(&, ÿ) = K(&-— ÿ) et X(2) est une fonction intégrable, alors la fonc- 


tion 
mx) = [... [ K(2-ÿ) EU) dÿ (3.33) 


sera également champ homogène. La fonction corrélative de ce champ est 
donnée par la formule 


B,(x) = f e [ KG) KO») B(X— Pi + De) dÿi dÿs, (3.34) 
et la mesure spectrale 7(X), par 


F,(4) = [ …. FAO Fe), (3.35) 
où 
Le _ À 
KG = Î ” [ A K(Dd8. (3.36) 


Si le champ £(*) admet une densité spectrale /:(1), alors le champ 
7%) admettra la densité spectrale 


A) = LEO 20). (3.37 
12.3,9, Transformation intégrale d’un champ de vecteurs homogène. Soient 
&(*) un champ de vecteurs homogène à valeurs dans R!, B:(%) sa fonction 
corrélative matricielle, F;(di) sa fonction spectrale matricielle. Soit par 


ailleurs une fonction matricielle X(*) de R' dans R? (c'est-à-dire une /Xp- 
matrice). Si tous les éléments de cette matrice sont absolument intégrables 
dans R*, alors l'intégrale 


10 = |... Î XG- 5) ÉE) dy (3.38) 


est définie (l’image de £ par K est un vecteur de R?), 7{%) étant un champ de 
vecteurs homogène à valeurs dans R?. La fonction corrélative matricielle 
B,{X) est de la forme 


BK) = [... Î KO) B(R-ÿ1+92) K°O) dj dÿs (3.39) 
et la mesure spectrale matricielle 


F,{(4) = | …. S RO) dFa(d?) R°() 41, (3.40) 
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k4Q) = [... [exp —i ; ie] k,CX) dx, 


où k, sont les éléments de la matrice K ; K* la transposée conjuguée de K. 


Si le champ EX) admet une densité matricielle spectrale || /21| (4), alors 
le champ 7%) admettra aussi la densité spectrale matricielle : 


LAID = RO) 11/11 À) K*() (3.41) 
(11,11 () est une /X/-matrice). 


12.4. Champs aléatoires isotropes 


12.4.1. Champs isotropes homogènes. On dit qu'un champ aléatoire E(X) 
défini sur R® à valeurs dans R'est homogène et isotrope s’il est homogène et 
sa fonction corrélative matricielle B(%) dépend seulement de | *|, où | *] est 
la norme dans R®. Si B(|*l) est la fonction corrélative d’un champ numé- 
rique homogène et isotrope, alors B(r) admet la représentation 


B(r) = ere) | Ju -2 Ur) dB), (4.1) 
2 
0 


où J,(2) est une fonction de Bessel du premier genre d'ordre k et D(4) une 
fonction à variation bornée non décroissante sur (0, cf. Entre la fonction 
(A) et la fonction spectrale du champ homogène on a la relation 
PG)= [  F(d). (4.2) 
\51 <4 
La fonction ®(À) s'appelle également fonction spectrale d’un champ iso- 
trope homogène. Elle s'exprime en fonction de B(r)au moyen de la formule 


= J,0r) ant 20 20 dr. (4.3) 


Fr] * 


2 


Ecrivons maintenant la représentation spectrale du champ lui-même. 
Soient (r, 0,,..., 0, p) les coordonnées sphériques d’un point de 
Rm(r€10, cf, € [5,5], p €10, 2xt). Désignons par 

SA(O 35 05 Omer Ps k=1,2,..., h(n, m) = 


_ Qn+m—2) (n+m—3)! 
i (m—2)1 n! 
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r suite orthonormée des harmoniques sphériques de degré n. Si EË(X) = 0, 
alors 


E: oo À(n m 
&n = 6 À so, RU 


2-m 
X [ Ju 9 (Qn) ? vä@i), (4.4) 
ñ der Tu 


m 
m\ 3 


où c? = 2-7 (5 )s et wyä(dÀ), n=0,1,...: K=1,..., (nu, m), 


sont des mesures aléatoires à valeurs complexes orthogonales sur [0, 
et, de plus, pour tous boréliens À, et À, de [0, cf 


Epa(4)) p/(43) = 65 [ dD(),  Eyi(A)) = 0. 
AN: 


12.4.2. Champs isotropes homogènes à valeurs dans R!. Soient B(|Z]) la 
fonction corrélative matricielle d’un champ isotrope homogène, b,,(r) les 
éléments de la matrice B(r). Alors 


œ 


m-2 
bitr) = 27 r(S) | Jn_2 (Ar) dP,5(7) (4.5) 
En 


0 
où les fonctions ®,,(4) sont définies sur [0, [, et, de plus, pour À, < 2, la 
matrice 
1,02) - B,,(4,)11 


est définie non négative. La matrice |1®,,(2)1| = (2) s'appelle matrice 
spectrale du champs isotrope homogène. La formule (4.5) peut être transcrite 
sous la forme matricielle 


m—? 
Br) = 2 © r(5) [ à On) db). (4.6) 
9 2 
La représentation spectrale d’un tel champ est 


ee oo  À(n, m) 
tn= cu Ë SO... px 


2-m 
X [ J nr? (Ar) (Ar) © QD), (4.7) 
+ 
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où ce, et Si sont ceux de la formule (4.4) et ÿ(d2) sont des mesures aléatoires 
deux à deux orthogonales à valeurs dans R' telles que 


E;ya(4) P( A3) = Î d®,(2) ; | 
And (4.8) 
Eÿ\(4:1) = 0 J 
GQyÉ, ..., 1ÿà) sont les composantes du vecteur ÿ). 


12.43. Champs isotropes sur une sphère. On dit qu’un champ aléatoire 
£(?) défini sur une sphère S de l'espace R" et à valeurs dans R! est isotrope 


si EË(X) est constante et la fonction corrélative matricielle B{%, ÿ) dépend 
seulement de la distance angulaire des points *, ÿ de la sphère. 

Soit £(%) in champ isotrope numérique sur la sphère S. Sa fonction 
corrélative est de la forme B(cos 0), où 0 est la distance angulaire des points 
de la sphère. Il existe des coefficients ne non négatifs tels que 


27 (cos ()) 


(1) 


où ©, cst le volume (m1 — 1)-dimensionnel au sens de Lebcsguc de la sphère 
unité dans R", C(-) des polynômes de Gegenbauer (cf. Szegô, G., Poly- 


nômes orthogonaux. M., Fizmatguiz, 1962) ct la série y bin, m) est 
n=0 


B(cos Y) = - È b, h(n, m), (4.9) 


convergente. 
Pour Eë(x) = 0 le champ aléatoire admet la représentation suivante : 


EC?) = S pa "SCD, (4.10) 


n=0 ki 


où &* sont des variables aléatoires telles que E£t = 0, Etké} = b,0jor. 
Supposons maintenant que £(*) est un champ de vecteurs iSotrope sur 
la sphère S. Sa fonction corrélative matricielle est 
U 
À AG, m) con B.. (4.11) 


Éd (1) 


où B, cest une suite de /X /-matrices symétriques non négatives telles que la 
série 


B(cos 0) = 


S A(n, m)B, 
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converge. Si EË(X) = 0, alors le champ est de la forme 
co A(n,m) 
ED = 5 S As), (4.12) 
0 El 
où Et est une suite de vecteurs aléatoires deux à deux non corrélés tels que 


(Et, ..…., té sont les coordonnées du vecteur £t, bf/ les éléments de la 
Da VER 
matrice B,). 


Chapitre 13 
MARTINGALES 


13.1. Définitions et exemples 


Les martingales et semi-martingales forment une importante classe de 
variables aléatoires possédant de nombreuses applications. 

Soient (9, ©, P) unespace probabilisé, T un ensemble ordonné quel- 
conque d'entiers (# discret) ou de réels (# continu) et {%,, ‘€ T} un flot 
de tribus %, € €, c'est-à-dire 

® € À 
pour s « /. 


Définition 1. Une famille de variables aléatoires {£(r), %, ; 1 € T} dans 
laquelle &(r) sont %,-mesurables pour 1€ T et El£(r)| < est une 


lesi 
E{E()/S,1 = Es), s<t, s,t1€T, (1.1) 
unc submartingale si E£*+(1) < oo ct 
ELEC, > É(S), s<1, s,1ET, (1.2) 
unc supermartingale si E£”(1) < co ct 
ELE()/S,] << ECS), 5 <1, s,1€T. (1.3) 


Les super- ct submartingales sont appelées semi-martingales. 

Lorsque f est continu, c'est-à-dire T'est un intervalle de l’axe numérique 
réel, les martingales et semi-martingales sont supposées séparables, 

De la définition il résulte que &, contient toujours la tribu engendrée 
par les variables aléatoires {£(s), s << f}. 

Cette tribu est souvent prise pour %, dans la définition d'une martin- 
gale (resp. semi-martingale). 

Dans les cas où le flot de tribus {%,, € T} est fixe, on omet souvent de 
le mentionner dans la définition de la martingale (resp. semi-martingale). 

La définition de l'espérance mathématique conditionnelle entraîne 
l'équivalence d'écriture des propriétés (1.1) à (1.3) : 


fét)aP = [E()dP, 46%,; (1.1) 
4 A 
féodP > [E)dP, A6; (1.21) 
4 4 
féu)dp « [Es)dP, 465%. (1.37) 
4 4 
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Des relations (1.1) à (1.3”) il s'ensuit que pour toute variable aléatoire 
n positive %,-mesurable sont respectivement réalisées les relations : 


Efé,-7] = Elé,-:n], s<t, s,1€T; (1.17) 
Efin]æ Efé,nl, s<4, s,1€T; (1.27) 
Efé,-n] < Efé,n], s<1t, s,1€ET. (1.37) 


Exemple 1. Soit £ une variable aléatoire et soit donné un flot 
de tribus {%,, ? € T}. L'ensemble des variables aléatoires 
= Efs/Bih !ET, (1.4) 
forme une martingale. 
Exemple 2. Soit {,,1> 1} une suite de variables aléatoires 
indépendantes telles que E£, = 0. Posons %, = uff,, 6, ...,6,} et 


DJ 
= 2 #2. La suite {&,, %, ; n > 1} forme une martingale. 


Exemple 3. Soit {;,, & > 1} une suite de variables aléatoires pos- 
sédant une densité de probabilité conjointe p,(x:, va, ..., x,) strictement 
positive pour tout n > 1. Soient q,(x:, x», ...,x,) des densités de probabi- 
lité. Les rapports de similitude 

ë es LA (ER se, ... 8) 
Ppésñssss ai 1 


forment unc martingale par rapport au flot de tribus 
#. = 0,6} n= 1 


n > À, (1.5) 


13.2. Propriétés des martingales ct semi-martingalcs 


1. Si £(r) est une submartingale, alors —5() est une supermartingale 
(ct inversement). Donc les propriétés des submartingales se formulent aisé- 
ment pour les supermartingales (ct inversement). 

2. Si {Ë(:), 1€ T} est une martingale, alors E{(r) = const. Si {(r), 
tET}est une submartingale, alors E{(r) est une fonction de { monotonc 
non décroissante. 

3. Si {£(4), 2 € T} est une submartingale, / (x) une fonction continue 
convexe et monotone non décroissante sur T et E/(£(r)) < pour ET, 
alors {f(&(r)), 1 € T } est également submartingale. 

4. Si {£(r), ET} est une martingale, f(x) une fonction convexe 
continue et E|f(£(r))|< pour ET, alors {/ (£(r)), 1 € T} est une 
submartingale. 

5. Si {£(r), r € T} est une martingale, alors E]£(#)| est une fonction 
monotone non décroissante sur T. 

6. Si {£(r), r € T} est une submartingale, alors {[£(r)—c]*, 1 € T} est 
également submartingalc. 
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7. Inégalités fondamentales, Soit {£(1, 1€ T} une submartingale. 
Pour toute constante positive c on a alors 


Ï 
P{ sup £*(1) — c} # - - Sup Ef*(r). (2.1) 
1ET Cucr 


Si, de plus, sup Ef*(1)}P = pour un p 1, alors 
ter 


E[ sup 0) Le C2) sup E{é+()} (2.2) 


Si {£(), 1€ T} est une martingale telle que sup E|£(r)|? < , alors 
ET 


| 
P{sup ÉOIE c} < 7 SupE lé()P. (2.3) 


Si l'ensemble T admet un élément maximum f,,, > ? pour tout # ET, les 
bornes supérieures des seconds membres des inégalités (2.1), (2.2), (2.3) 
sont atteintes au point fr. 

8. (Inégalité de Doob). Soit »[a, b[ le nombre d'intersections de l'inter- 
valle ouvert {[a, b[ de haut en bas par la submartingale {é(r), 1€ T} ; 
r{a, b[ est la borne supérieure des nombres s tels qu'il existe une suite 
{i=1,2,...,2s},t; < tign € T, pour laquelle 


4 æb, t)<a Et) >0b,...,8Ë(41,) <a. 
r[a, b[ est une variable aléatoire et vérifie l'inégalité 
0e E{é()—b]* 


Er{a, b[ < — 


(2.4) 


13.3. Fermeture, intégrabilité et existence de la limite 


Définition 1. Une variable aléatoire £ s ‘appelle fermeture à droite d’une 
submartingale {£(r), 5, r € T}si EËt < oo, E est mesurable par rapport à 
la tribu % = o{%, 1€ T},et pour tousles 1 ET 


Er) < ElE/S,]. (3.1) 


Si l'ensemble T possède un élément maximum f,,., alors la submartin- 
gale OA ÿe! € T}est fermée à droite par la variable aléatoire £ = £(r..,,). 
éorème 1. Soir {E(1), %, 1 ET} une submartingale définie sur un 
AR T. Les trois conditions suivantes sont équivalentes : 
a) {E(r), %, ? € T}est fermée à droite ; 
b) /a famille {Ë(r), t € T}est uniformément intégrable ; 
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c) il'existe la limite au sens de la convergence dans L, : 
lim Elé()-£| = 0. 


{fmax 


Si l'une de ces conditions est réalisée, im &(r) = Ë existe presque sûre- 
: 1Ttmax 

ment et Ë est fermeture à droite de la submartingale. 

Remarque. Dans la définition 1 et dans le théorème 1 on peut remplacer 
le terme de submartingale par martingale et le signe d’inégalité dans (3.1) 
par le signe d'égalité. 

Théorème 2. Soit {£,, %., n > 1} une martingale. Les trois conditions 
suivantes sont équivalentes : 

a) /a famille {Ë,, n = 1} est uniformément intégrable ; 

b) /a martingale {£,, ÿ., n > 1} admet une fermeture à droite : 

c) Elé,—-£é,1— 0 pour n,m —+ co. L 

Si l'une de ces conditions est remplie, lim £&, = Ë existe presque 

{ —+ © 

sûrement et £ est fermeture à droite de la martingale. 

Si, de plus, est réalisée la condition 


sup Eit < ©, (3.2) 


nl 


alors lim £&, = Ë existe presque sûrement et £ est fermeture à droite de 


ñn —+ 00 
la submartingale (resp. martingale ). 
Dans les théorèmes suivants, T est un intervalle de l'axe numérique 
réel (éventuellement infini). 
Théorème 3. Une submartingale séparable {£(1), 3, t ET} ne possède 
pas de discontinuités de seconde espèce sur l'intervalle T. 
Soit S:40 l'intersection de toutes les tribus %, pour s > #. Alors 
&(1 +0) est une variable aléatoire %,,.-mesurable. 
Théorème 4. (Régularisation d’une submartingale à droite). Soit 
$C), Sn LE T} une submartingale définie sur l'intervalle T. Alors {£(t+0), 
150 (ET} est également une submartingale dont les réalisations sont 
presque sûrement continues à droite. En outre, P(È(:) = ë(t+0)) = 1 en 
tout point dans lequel EË(+) est continue et Si40 = Sr 
Si T possède un élément maximum 1, alors Ets +0) = Etmax). 


13.4. Temps d'arrêt et changement aléatoire du temps 


Soient 7 un ensemble d’instants pendant lesquels sont réalisées des expé- 
riences ; (5, # € T} le flot de tribus des événements observés pendant ces 
expériences. D'après les résultats des expériences réalisées on définit l’ap- 
parition d'un événement À qui peut se produire à un instant aléatoire +. 

L'événement {r « !} signifie que À a eu lieu avant ou à l'instant #, 
donc doit être observé pour la suite d'expériences réalisées aux instants 
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s&<t, SET, c'est-à-dire l'événement {tr <1} doit être %,-mesurable : 
{r &<1}EY,. De telles variables aléatoires sont appelées instants aléatoires 
ne dépendant pas l’avenir ou instants markoviens ou temps d’arrêt, 

Voici la définition formelle. 

Définition 1. On appelle temps d’arrêt (ou instant markovien par 
rapport au flot de tribus {Y,, € T}), définit sur l'espace probabilisé (9, €, P), 
unc variable aléatoire t = 7(w) à valeurs dans 7, définie sur un sous- 
ensemble £, de l'espace des événements élémentaires 2, telle que l'événe- 
ment {r < 1} EVn V'ET. 

L'ensemble £2, correspond à l'événement : x s'est Po à un instant 
tET. Si T admet un élément maximum #,., alors Q, = {rt = 1} Si 
T ne possède pas d'élément maximum, alors $, = U {t & !,} pour la suite 


tt sup{t: ET). 

On remarquera que la condition en «& À EY: <uaus à la suivante : 
{rt > LL € , ou, si T'est dénombrable, {rt = 1}€%,, V'ET. 

Le temps d'arrêt + définit la tribu des événements observés avant 

l'instant +. 

Définition 2. On appelle tribu engendrée par le temps d’arrêt 7 la tribu 
Dr de tous les événements B tels que BN{r = 1} € Y.. 

Propriétés des temps d’arrêt. 

1. La constante 7 = #, € Test un temps d'arrêt. 

2. Si X est un borélien de l'axe réel et {supx: xEK} «1, alors 
l'événement {r € K} est %,-mesurable. 

3. Si une fonction borélienne réelle 0(1) applique T dans T et vérifie 
la condition Ü(r) = #1 pour tout 1€ 7, alors Ü(r) est un temps d'arrêt. 

4. Si + et p sont des temps d'arrêt, alors max (7, e) = sup (r, p) et 
min (7, 0) = inf (7, e) sont aussi des temps d'arrêt. 

5. Si des temps d'arrêt 7 et p sont tels que 7 & p presque sûrement, 
alors r € Ye: 

6. Soient T un ensemble fini ou dénombrable, {£(), 1€ 4 unc suite 
de variables aléatoires subordonnées à un flot de tribus {9,4 1€ T}, v 
un temps d'arrêt tel que {2, = 42. Alors la variable ra es est Y:- 
mesurable cet définie pour tous les & € 92. 

7. Soient {£(r), ,, t € T} une submartingale fermée à droite (continue 
à droite dans le cas continu), 7 et p des temps d'arrêt, définis pour tous les 
wo € {Jet tels que r = 0. Alors 


E{S(o)/Sr) = é(r). (4.1) 
Si {ë(r), Sa 1 € T} est une martingale fermée à droite, alors le signe d'éga- 
lité cst réalisé dans (4.1). 
8. Soient {£(r), ÿ, 1 € T} une submartingalc fermée à droite (continue 
à droite dans le cas continu), {7r,, 5€ S} une famille croissante de temps 
d'arrêt définis sur 2 (F, 7, pour s,&s,). Alors {(.). Ÿ, » sES} 
est a. une submartingale. 
processus {£(7,), Sn s€S} s'appelle transformé du processus 
{£ +: œ D 1 ET} par le changement aléatoire de temps {r,, 5€ S). 
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9. Soient {é,, 3, n > 1} une martingale, r un temps d'arrêt, E | &, 1 < oo 
ct lim f é,dP =: 0. Alors Eë, : Eë,. 


N — © > 
10. Si {£,, <. n = |} est une martingale bornée : |£,| — c presque 
sûrement pour tous les n = 1, alors Ef, — Eÿ.. 
11. (Identité de Wald). Soient {&,, n = 1} une suite de variables aléatoi- 
res indépendantes identiquement réparties telles que E10,| < et + 
un temps d'arrêt par rapport au flot de tribus {%, = of, C2, ..., 6), 
n > 1}tel que Er < co, alors 


E> ts = EEr. (4.2) 


12. Soient 7 un temps d'arrêt par rapport au flot de tribus {%,, n> 1}, 
7 une variable aléatoire d'espérance mathématique finie. On a alors la 
formule 


F{y/S = À En Blé mn FN ele (4.3) 
où 
Ve = Sn > 1). 


On remarquera que 


E{nZcx = n Dr) = Enr = nn]. (4.4) 


13.5. Applications 


Les propriétés des martingales et semi-martingales et en particulier l'exis- 
tence de la limite (cf. 13.3) jouent un rôle important dans la théorie moderne 
des processus aléatoires. 

1. Jeux stochastiques. Considérons une suite de variables aléatoires 
(6, n > 1} dans laquelle &, peut être traité comme le gain (positif ou 


négatif) à la n-ième répétition du jeu (partie). La somme &, = Ÿ 6, est 
km] 
le gain total en n parties. Le jeu est à somme nulle si pour tout n > 1 
Efbua/Qis ce. Ga) = 0. 


Dans ce cas la suite {£,, n = 1} forme une martingale telle que 
EË, = 0. | 
Le jeu est à somme non nulle si pour tout n = 0 


Efén4n/6u 6x) > 0. 


Dans ce cas la suite {£,, n = 1} forme une submartingale. 

L'impossibilité d'un système de jeu à somme nulle, fondée sur un 
temps d'arrêt 7, découle de la propriété des temps d'arrêt E£, = 0. De sorte 
qu'ilest impossible d'accroître le gain moyen par le choix du temps d'arrêt. 
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2. Promenade aléatoire bernouillienne sur un intervalle. Soit {4,,k > 1} 
unc suite de variables aléatoires bernouilliennes indépendantes: P{, = 1} = 


-p, Pfi=-1}=qg=1t-p Soit s,= ÿ'&, næl. La suite de 
| 


variables aléatoires {£, = {[q4/p]", n > 1} forme une martingale telle que 
Eë, = 1. Introduisons le temps de première sortie de la promenade aléa- 
toire bernouillienne {s,, # 1} de l'intervalle Ja, b[, le temps d'arrêt 
Tr = inf{n: 5,64 Ja, b[}, où aet b sont desentiers, a < 0 < b. 


Soient P{s, = a} = p,, P{s, = b} = 1-—p.. De l'équation Eë, = 1 on 
déduit p, = [1-— lp) GP) — (g/p)'}pourp = q. 
3. Loi de tout ou rien. Soient {%,, 7 = 1} un flot de tribus, % = 


= 0{ÿ,, n> 1). Si AE, alors lim Elx8,| = Jim P(4/,) = 44 
presque sûrement. Si, cn particulier, AE (No{ÿ,;x kæ 1}, alors 


El 4/81] = P(4A) = 1 ou 0 pour tout y. 
4. Convergence des séries. Supposons qu'une suite de sommes 


CL 
{> Vi 1> 1} forme une martingale et que ses termes sont uniformé- 
Ami 


ment bornés : [| «& © < co, La série 2 &, est presque sûrement conver- 
1 


gente vers une variable aléatoire finie si, et seulement si, la série 
pa E(L2/%, -1] cst presque sûrement convergente vers une variable aléa- 
toire finie. 

En particulier, dans le cas de variables aléatoires indépendantes 
(a k æ 1} telles que EF, = 0, la finitude de la somme > E 3 entraine 


Le 3 
la convergence de la série L Ge 


S. Loi forte des grands nombres. Supposons que la suite des sommes 
{> bone 1} forme une martingale. Si ÿ _ E£3 < co, alors 
&= 1 næi 


] = a 
m. SG + 0 presque sûrement pour n —+ co. 
&=1 


6. Continuité absolue des mesures. Soient (X, 3, P) un espace proba- 
bilisé, 4(4) une mesure sur (4, 3) absolument continue par rapport à P et 
telle que q{(£) < ©. Supposons que la tribu 8 est engendrée par une suite 
dénombrable d'ensembles 8 = o(B;,, B:, ..., B,, ...). Il existe alors 
dans l'espace mesurable (X, 8) une suite exhaustive de partitions : 
{4Au;næ1l,k > 1}, vérifiant les conditions : a) 44€ B, 4414, = © 
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œ 
pour &k mr; (J 4u = 8 ; b) la (n+1)-ième partition est une sous-parti- 
kml 


tion de la n-ième partition, c'est-à-dire pour tout 4,;1u € 4,, pour un 
r = rk) ; c) la plus petite tribu contenant tous les 4,, n> 1,k= 1 est 
confondue avec 8. 

Posons 


_ A4atx)) 

P(4, (x) 
pour P(4,(x)) > 0, où 4.,(x) est l'ensemble des partitions {4,,, k > 1} qui 
contient le point x. Si P(4,(x)) = 0, on posera g,(x) = 0. Alors la suite 


{gns Fn 2 > 1} forme une martingale pour #, = 0{(4,, k > 1)}. La limite 
g(x) = lim g,(x) (mod P) existe et ne dépend pas du choix de la suite 


A6 S (5.1) 


exhaustive de partitions {4,4 ; # > 1, k æ 1}. Pour tout ZE on a la 


formule 
aB) = [sx PG@x), BES. (5.2) 
8 


7. Mesures stochastiques. Soit {£(r), %.,, { € T} une martingale séparable 
sur un intervalle T de l'axe numérique réel telle que E 1é(r) |? << ©. 
Considérons sur le demi-anneau M de tous les intervalles ouverts 41 — 
= ]s,t] GC Tla famille de variables aléatoires hilbertiennes 


(4) = 8) —E(S). 


La propriété de la martingale {£(r), %,, 1€ T} implique que {{(4), 
AE} est une mesure stochastique orthogonale élémentaire de fonction 
structurelle m(41) = E|£(4)|?, prolongeable en une mesure sur TJ. 


13.6. Décomposition des semi-martingales 


13.6.1. Temps discret. 
Définition 1. On dit qu’une supermartingale non négative {7,, %,, 
n æ 1}est un potentiel si 
lim Ex, = 0. (6.1) 


ñn —+ 
On remarquera que lim 7, = 0 presque sûrement pour un potentiel. 


Théorème 1 (Décomposition de Riesz). Si une supermartingale {£,, %.. 

n æ 1} majore une submartingale {&,, 3, n> 1}: &, = 6, pour tous les 

n > 1, il existe alors une martingale {u,, ., n > 1} et un potentiel 
{rs Vu æ 1} tels que 

En = UHntlm 1næ1 (6.2) 


pour tout n æ 1. 
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La décomposition (6.2) est unique à l'équivalence stochastique près. 


Soit {&, Yn 1 > 0} une supermartingale. Définissons les variables 
aléatoires /1,,«, comme suit : 


lo = 0 &o = 0, 
la — Uo+Tfi-Elé:/Sol], ar = Éo— EË1/o), 
Un = Uni + EE JT 1), y — anni +1 EE Y- 1). 


Le processus {u,, %., n > 1} est une martingale, {«,, %,, n= 1}, un 


processus croissant : «,,, > &, et, de plus, «, est une variable aléatoire 
D,.-.1-mesurable. 


On a la décomposition 
= Um  næ> 0. 


Définition 2. On dit qu'un processus aléatoire {«,, %., 1 > 0) est crols- 
sant si, ; > &, (mod P) pour tous les n > 1 eta, = 0 ; naturelsia,,, sont 
des variables aléatoires %,-mesurables (n > 1). 


Théorème 2 (décomposition de Doob). Tou:’e submartinale {£,, &,, 
n > 0} admet une décomposition unique (à l'équivalence stochastique près) 


= Hot n>0, (6.3) 


où {uns Sn 1 > 0} est une martingale, {«,, ., n > 0}, un processus naturel 
croissant. 


En particulier, le potentiel {7,, Ÿ., 7 = 0} se représente sous la forme 
74 = Eltoo/Da] Ans (6.4) 
où {«,, ÿ., 1 > 0} est un processus naturel croissant. 


13,6.2. Temps continu. 

Définition 3. On dit qu’un processus aléatoire continu à droite 
{a(r), , ! æ 0} est croissant si «(0) = 0 et a(s) «< a(f) pour s & f (mod P) 
et naturel si pour toute martingale {£(f), %,, ! æ 0} bornée presque sûre- 
ment non négative, possédant des limites à gauche, on a la relation 


E J &(—0) da(r) = EËa, (6.5) 
0 
où L 
Ë = lim &(), &= lim a(r). 
{ —+ © 8 —+ co 
On dit qu'un processus croissant est intégrable si sup Ea(f) < co. 


Ci 
Pour qu’un processus croissant intégrable {a(s), Ge t > ne naturel, 
il faut et il suffit que pour toute martingale {£(r), $,, ? æ 0} continue à 
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droite bornée et possédant des limites à gauche l’on ait 
r r 
E [ &(r) da(r) = E [ &(1—0) da(r). (6.6) 
0 () 


Théorème 3 (décomposition de Doob-Meyer). Soir {n(1), %,, 1 = 0} 
un potentiel continu à droite tel que la famille de variables aléatoires {{1), 
TES}, où Ÿ est un ensemble de temps d'arrêt + tels que P{t < >} = 1, 
soit uniformément intégrable. Il existe alors un processus naturel crois- 
sant intégrable {a(t), %,, t = 0} tel que 


a(t) = E[&/ÿ,)-a(r), 1 01mod P), (6.7) 


où &ä= lim at). La décomposition (6.7) est unique à l'équivalence 


{ —+ © 
stochastique près. 

Corollaire. Soit {é(r), %, t = 0} une supermartingale continue à droite 
pour laquelle la famille de variables aléatoires {£, (7), r€ 3} est uni- 
formément intégrable. Il existe alors une martingale uniformément intégra- 
ble continue à droite {u(r), %, t = 0} et un processus croissant naturel 
intégrable {a(r), %,,  æ 0} tels que 


E(s) = p()-a(r), 1 > 0 (mod P). (6.8) 


La décomposition (6.8) est unique à l'équivalence stochastique près. 

Remarque. La décomposition de Doob-Meyer (6.7) et (6.8) a lieu 
dans le cas où l’ensemble des temps d'arrêt finis 3 = {r: P(r <)= 1} 
est remplacé par l'ensemble des temps d'arrêt bornés 4, = {r: P(r & a) = 
= 1}. Dans ce cas seulement E& & co. 

Définition 4. On dit qu'un processus aléatoire {u(r), %,, t æ 0} est 
une martingale locale si existe une suite croissante de temps d'arrêt 
{t,æ 1} par rapport au flot de tribus {%,/æ0}, telle que: 
a) P{r,æ<n}=1, Pflimr, =c}=1; b) {u(inf(r, r)), 3, 1 æ 0) 
est une martingale uniformément intégrable pour tout n = 1. 

On remarquera que toute martingale à trajectoires continues à droite 
est une martingale locale. 

Théorème 4. Soit {£(r), %,, t æ 0} une supermartingale non négative 
continue à droite. Il existe alors une martingale locale continue à droite 
{a(r), Gr ? æ 0} et un processus croissant naturel intégrable {a(r), ÿ,, t = 0} 


tels que 
E(r) = u(t)-a(s), 1 > 0 (mod P). (6.9) 


La décomposition (6.9) est unique à l'équivalence stochastique près. 


13.7. Martingales de carré intégrable 


Définition 1. On dit qu’une martingale continue à droite {E(r), %,, 1 = 0} 
est de carré intégrable si 
sup E!*(1) = ©. (7.1) 


TE. 


La décomposition de Doob-Meyer de la martingale de carré intégrable 
{E(), G ! æ 0} est de la forme 


E) = HG)+ hs  1>0, (7.2) 


où {u(r), %,, t æ 0} est une martingale, a«(r) = (£),, le processus croissant 
naturel correspondant à £(r). Le processus (£), s'appelle caractéristique de 
la martingale de carré intégrable £(r). De plus 


E[(()—E(5))/5.] = EL) - 9/8, (7.3) 
pour $ <= !/. 


La caractéristique mutuelle ee des martingales de carré intégrable : 
(EG), %, 1 > 0} et {r), %,, 1 > 0j est définie par 


En) = LE +0) CL (7.4) 


L'adéquation de l'introduction de la caractéristique mutuelle de deux 
Ha est liée au fait que le processus (1) (1) — (Ë), est une mar- 
tingale. 

Définition 2. On dit que deux martingales {{(r), %,, 1 æ 0} et {r(r), 
Wn ! æ 0} de carré intégrable sont orthogonales si le processus {£()r{r), 
Vs ! æ 0} est une martingale. 

Si {(), ,, t æ 0} et (0), S,, 1 > 0} sont des martingales orthogona- 
les de carré intégrable, alors leur caractéristique mutuelle (£7), = 0 (mod P). 

Une condition nécessaire et suffisante pour que Îles martingales de 
carré intégrable {£(r), ,, ? = 0} et {r1), %,, ? æ 0} soient orthogonales est 


que 
+ = (+1), (mod P). 


Exemple 1. Le processus wienérien {#,, 4", 0<1«T}), où 
GS} = o{W, s&1} est une martingale de carré intégrable telle que 
(Wy=t. 

Exemple 2. Supposons que af, w) soit %}”-mesurable pour 


Tr { 
chaque # et E | at, w) dt < co. Le processus [| as, ©) dW,,%}, 
0 


0 
0«I< r} est une martingale de carré intégrable telle que 


{ [ as, w) a.) = f as, w) ds. 
0 5 0 
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Théorème. Soient {Ë(r), %,, 0 1 &T} une martingale de carré 
intégrable et {W,, %,, 0 &t «T} un processus wienérien. Il existe alors 


un processus af, ©) Y,-mesurable pour chaque t tel que FE | at, w) dt = 
et une martingale de carré intégrable {{(r), 5,, 0 = 1 T\tels que 


E(e) = [ es, w)dW,+é(), 0<1t<«T(modP), (7.5) 
0 


et 


EW), = j ds, w) ds, 0&1t=«T(modP). (7.6) 
0 


! 
Ceci étant, les martingales f ds,w)dW, ÿ, 0<I& 7} u{E(8), Fr 
(1 


0 & t & T} sont orthogonales. 


Chapitre 14 
PROCESSUS MARKOVIENS 


14.1. Fonctions aléatoires -markoviennes 


14.1.1. Propriété de Markov. La notion de processus markovien est basée 
sur l'idée de systèmes stochastiques évoluant dans le temps et jouissant de 
la propriété d’«absence de post-action » («absence de mémoire »). Ces 
processus à temps dicret, appelés chaîne de Markov, ont été examinés au 
chapitre 8. Dans ce chapitre on étudiera les processus de Markov à temps 
continu. On supposera que le temps varie dans un intervalle (fermé ou 
ouvert) ‘©, contenu dans l’ensemble de tous les réels non négatifs. En parti- 
culier, il est possible que "© = [0, 1. 

Soient donnés : 

a) un espace probabilisé (9, 0 P 

b) un flot de tribus {ÿ,, 1€ à c'est-à-dire une famille de tribus 
(Sn 1 € O} telle que G, € Het F, € Fpours «!,5,1€ 0 ; 

c) une fonction de deux variables £(t) — ë(s, w), 1 € ‘©, w € {2 à valeurs 
dans un espace mesurable (X, 3), telle que &(r) est une application mesurable 
de l'espace (9, %,) dans (X, 3) pour chaque f € ” 

Nous venons de définir un processus aléatoire £(:) subordonné au 
flot de tribus {ÿ,, 1 € ‘O}. En particulier, la tribu #, peut être confondue 
avec la plus petite tribu des événements de la forme {w: &(s)€ l'}, T'ES, 
sE O,s «t. Dans le cas général, la tribu est plus large. 

Définition 1. On dit qu'un processus aléatoire E(#) subordonné à un 
flot de tribus %, possède la propriété de Markov par rapport à ce flot si 


la relation 
P{E() € TJS.) = P{È() € L'IE(S)} 


est presque sûrement réalisée pour tous les s = # (5,1 € O), l'E 3. 

Un tel processus s'appelle fonction aléatoire markovienne. Nous 
réservons Île terme de «processus markovien » pour une autre notion, plus 
commode (du point de vue de l'étude de la propriété de Markov), liée à 
une famille entière de fonctions aléatoires markoviennes (voir également 
chapitre 8). 

Si &(r) est traité comme l'état (la position) d’un système (d’une particule) 
à l'instant s, alors la propriété de Markov signifie que ce système jouit de 
la propriété d'absence de post-action : la connaissance de la position du 
système considéré uniquement à un instant «présent » est essentielle lors 
de la prédiction (en moyenne) du comportement du système sur le vu des 
observations de ce système à tous les instants «antérieurs» à l'instant 
«présent ». 
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Soit {£(1), 1€ ©} un processus aléatoire à valeurs dans un espace 
mesurable (X, 3) subordonné à un flot de tribus {%,, t € ©}. Désignons par 
%, la plus petite tribu d'événements engendrée par les événements de la 
forme : {w: #s5)€l'}, s&<t (5, 1€ "O), l'E B, par À! la plus petite tribu 
contenant les événements de la forme {w: &(s)€l'},s æ1(5,1€"O), l'E. 
On remarquera que J, c By et que si é(r) possède la propriété de Markov 
par rapport au flot {ÿ,, # € ‘O}, alors é&(r) possède cette propriété par rapport 
au flot {9,, € "O}. 

La propriété de Markov du processus {£(r), 1 €"O©} par rapport au 
flot de tribus {%, 1 € ©} est équivalente à l’une quelconque des pro- 
positions suivantes : 

1. pour toute fonction f(x), x EX, bornée S-mesurable et tous 
s«t(s,1€ O) 


E{/(4())/5.} = E{/(&O)/Ë(G)}  P-presque sûrement ; 


2) pour toute variable aléatoire 7 bornée %'-mesurable ct tous 


s&<t(s,1€ O) 
E{n/%:}= Eln/Ë(s)}  P-pss. ; 
3) pour tous événements À €)! et BEY, 
P{A N BJE()} = P{AJE()} PLBJE())  P-p.s. 


La dernière propriété signifie que pour un processus jouissant de la 
propriété de Markov les événements «futurs » et «passés » pour un «pré- 
sent » fixe sont conditionnellement indépendants. 


14.1.2. Probabilité de passage. Soit {£(1), 1€ ©} une fonction aléatoire 
markovienne à valeurs dans (X, $) par rapport à un flot de tribus 
{%o t € ‘O}. Une conséquence de la propriété de Markov et de la formule 
des probabilités totales est la relation suivante : 


P{E(r3) € T'/Ë()} = E{P{E( 3) € T'IÉ(1:)}/Ë(:)} 


qui est valable P-presque sûrement pour tous les l'EBetr;, <ts<ts 
(li las 3 € O). Cette relation s'appelle équation de Chapman-Kolmogorov. 

Un cas particulièrement intéressant est celui où la probabilité condi- 
tionnelle P{£(:) € l'/Ë(s)} admet une probabilité conditionnelle régulière, 
c'est-à-dire une fonction P(s, x, #,1,XEX, TEB,s<1(s, 1€ "O), telle 
que soient réalisées les conditions : 

a) la fonction P(s, x, ?, [') est une mesure probabiliste sur (4, 8) pour 
5, X, t fixes ; 

b) la fonction P(s, x, t, 1") est B-mesurable pour s, #, l'fixes ; 

c) P(s, (5), 1, 17) = P{6() € TJE(S)} p.s., Vs, V4, VT. 

Etant donnée une fonction aléatoire markovienne la fonction 
P(s, x, 1, T") vérifiant les conditions a), b), c), s'appelle probabilité de pas- 
sage. 1l existe une fonction P(s, x, t, I") jouissant de ces propriétés, pour 
des hypothèses assez larges (par exemple, si X est un espace polonais et 3 
tribu de ses boréliens). 
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En termes de probabilité de passage, l'équation de Chapman-Kolmo- 
gorov s'écrit 


Ps CG) ta 1°) = (| Pas ds tas D) PC ËC), tas dv) P-ps., 
X 


OÙ fi <a < la (fl, fn 13€ O), l'E. On supposera toujours qu'est 
réalisée une relation un peu plus forte pour la probabilité de passage 
appelée aussi équation de Chapman-Kolmogorov. Plus exactement, on 
admettra que quels que soient x € X, l'EBet 1, < 13 < ati ta t3 € ©) 


Pix ta D) = À PU ps ta D) Pa X, tas dy). 
X 


14.1.3. Equivalence stochastique. Les lois finidimensionnelles d’une fonction 
aléatoire markovienne ne sont pas définies par la seule probabilité de pas- 
sage. Si ‘© admet un élément minimum #,, alors la connaissance de la loi 


initiale 
n(l')= P{(G)E l'},  l'EB, 


et de la probabilité de passage P(s, x, ?, 1") de la fonction aléatoire marko- 
vienne nous permet d’en déterminer toutes les lois finidimensionnelles. En 
effet, pour 4 <t1 < ... < 1m To l'y ..., 1,EBona 


P{F(0) € l'os EG) E ln ..., QG) ET} = 
= fu(dxo) Ÿ PGos Xor fi dx)... [Par Xe-ns a dx). 
r, r, 


Th 

Ainsi donc, si les lois initiales ct les probabilités de passage de deux 
fonctions aléatoires markovicnnes définies éventuellement sur des espaces 
probabilisés différents sont confondues, alors toutes les lois finidimension- 
nelles le seront également. Cela signifie que deux telles fonctions aléatoires 
markoviennes sont stochastiquement équivalentes. 

Si “© possède un élément minimum #, et si sont données une mesure 
probabiliste y, définie sur (X, 8), et une fonction P(s, x, #, 1), 105 < 1, 
5,16€ O,xE X, l'E B, vérifiant les conditions a), b) du numéro 14.1.2 et 
l'équation de Chapman-Kolmogorov (voir la dernière relation du numéro 
14.1.2), alors on peut toujours construire sur un espace probabilisé une 
fonction aléatoire markovienne pour laquelle la mesure y serait loi ini- 
tiale et la fonction P(s, x, #, 1”), probabilité de passage. 

Supposons maintenant que ‘© ne possède pas d'élément minimum. 
Si {£(1), 1€ ‘O} est une fonction aléatoire markovienne, on posera 


u(l) = P{G)ETY, 1ET, Tres. 


z, est une mesure probabiliste sur (X, 8) pour chaque r € ‘©. On l'appelle 
loi d'entrée de la fonction aléatoire markovienne considérée. La loi d'en- 
trée est reliée à la probabilité de passage par la relation suivante : 


UT) = fadx) P(,x, 1), s<t(s1€T), T'ES. (1.1) 
ï 
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Sachant la’loi d'entrée ct la probabilité de passage d'une fonction 
aléatoire markovicnne, on peut en définir toutes les lois finidimensionnelles : 


P{() El", ...,8G,) € 7} = : 
= el (dx) [Pt Xi los dx3) Se Î P(l-1 Ni. !., dx), 
r I s 


où <a... < [ACT las. 5 1, € O), 1°, .., 1,€ 9. 

Donc, dans le cas considéré, la fonction aléatoire markovienne cst 
définie de façon unique à l'équivalence stochastique près par sa loi d'entrée 
et sa probabilité de passage. 

Inversement, si sont données une famille de mesures probabilistes 
ut), 1€ O, T'ES, et une fonction P(s, x, 1, l},s<t(s, 1€ O),xEeX, 
l'E B, vérifiant les conditions a) et b) du numéro 14.1.2 et l'équation de 
Chapman-Kolmogorov, telles que soit réalisée (1.1), alors il existe sur 
un espace probabilisé une fonction aléatoire markovienne dont la loi 
d'entrée est confondue avec y4, et la probabilité de passage avec P(s, x, t, T”). 


14.1.4. Fonctions aléatoires markoviennes tronquées. En pratique on a 
parfois affaire à des systèmes que la fonction aléatoire markovienne telle 
qu'elle vient d’être définie ne suffit pas à décrire. 

Supposons, par exemple, que &(:) désigne la taille d’une population 
biologique à l'instant s. Alors (1) est un processus aléatoire dont l'espace 
des phases est composé de tous les nombres naturels. Il peut s'avérer que 
l'intensité de reproduction de cette population soit si élevée qu’au bout 
d'un certain temps fini (généralement aléatoire) la taille de cette population 
devienne infiniment grande. Donc, on sc trouve ici dans une situation dans 
laquelle le processus &(t) n'est défini que sur un intervalle temporel aléatoire 
au bout duquel le processus disparaît de l'espace des phases (arrêt, cx- 
plosion, mort). La définition ci-après de la fonction aléatoire markovienne 
tient compte d'une telle éventualité. 

On admettra que ‘© = [f,, ©]. Soient donnés : 

a) un espace probabilisé (92, A, P) ; 

b) une variable aléatoire & = &(w), w € 2, à valeurs dans l'intervalle 
achevé [fo, ©] ; 

c) une tribu %, de parties de l'ensemble 9, = {w: &(w) > 1} pour 
chaque 1 € ©, de plus G[9,] € Ÿ, € À pour s 7 (s, 1, €"O), où %,[9,] 
est la trace de la tribu %, dans l'ensemble 2, c'est-à- dire l'ensemble de 
tous les ensembles de la forme 4AN9,, A EX, ; 

d) une fonction de deux variables &(r) = &(r, w), © € Q, 1€ [to, É(w)l 
à valeurs dans un espace mesurable (X, 3), telle que l'on ait {w: &(1, w) € 

€} € %, pour tous les 1€ Cet l'E B. 

Définition 2. Le système d'objets a) à d) définit une fonction aléatoire 

markovienne tronquée si 


P{é(r) € 1%.) = P{E(r) € TJË(s)} 


P-presque sûrement sur l'ensemble 92, quels que soient s = # (s, 1€ ©), 
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T'ES. (En d'autres termes, cette relation est réalisée pour presque tous 
les © € 2, par rapport à la mesure P.) 

L'instant &(w) s'appelle temps d'arrêt de la fonction aléatoire marko- 
vienne, la quantité É(w)—1,, sa durée de vie. 

Le second membre de l'équation de la définition 2 est la probabilité 
conditionnelle par rapport à la tribu des parties de l'ensemble 9, de la 
forme {o: &(s) € I}, l'E. 

Supposons que pour P{i(r) € 1'’/E(s)} existe une probabilité condi- 
tionnelle régulière, c'est-à-dire une fonction P(s, x, 1, 1),xEX,s<1 
(s,1€ O), T'E B, vérifiant les conditions : 

1) la fonction P(s, x, ?, 1”) est une fonction SB-mesurable de x pour 
s, ?, l'fixes ; 

2) P(s, x, t, T)est une mesure sur (X, 8) (pas nécessairement probabi- 
liste, puisque P(s, x, ?, X) 1) pour s, x, ! fixes ; 


3) P{E(r) € T'JË(s)} = P(s, (5), 1, 1)  P-pss. 


sur l'ensemble 4, pour tous les s « # (s, 1€ O), l'E 5. 

Dans ce cas la fonction P(s, x, #, l") s'appelle probabilité de passage 
de la fonction aléatoire markovienne. Elle s’interprète comme la proba- 
bilité conditionnelle de l'événement {£()€ T°} sachant que &(s) = x. 
En particulier, 1—P(s, x, t, X) cst la probabilité conditionnelle que la 
fonction aléatoire markovienne soit tronquée (disparaisse de l'espace des 
phases) à l'instant # sachant que &(s) = x. 

On notera que si E(w) = + co, la définition 2 se transforme en celle 
d'une fonction aléatoire markovienne non tronquée, définie sur ‘© = 
= [to, cf (cf. définition 1). 

On peut toujours transformer une fonction aléatoire markovienne 
tronquée en fonction non tronquée. A cet effet étendons l’espace X en lui 
ajoutant un point « impropre » a & X. Posons X{° = XU a). Désignons 
par #8‘ la tribu des parties de X‘*, composée des ensembles 7'€B ct 
des ensembles de la forme J'U{a}, l'E D. 

Par ailleurs, pour «€ {&(w) < }, posons &*(r, «w) — 

a si 41>(; 


léto) si 1er, t@' 
lo &  < ©, comme la plus petite tribu des parties de © contenant toutes 
les tribus $, pour s «1. Alors les tribus %!°, s € "©, forment un flot auquel 
le processus {K°%r), rs € ©} est subordonné. Il est immédiat de vérifier 
que {£t(r), 1 €”O} est une fonction aléatoire markovienne par rapport 


au flot {ste 1€ TO} au sens de la définition 1 (c'est-à-dire est non 
tronquée). La probabilité de passage P(s, x, #1, I") de cette fonction 
aléatoire est 


Définissons enfin la tribu %!, 


P(s,x,1, IN X)+3%r(a)(1-P(5, x, 1, X)] pour x#a; 


P(s, x, 1, ) = (0) pour x = 4, 
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où P(s, x, ?, l')est la probabilité de passage de la fonction aléatoire initiale 
(tronquée). L'état a est absorbant pour le processus {£°(1), 1€ CO). 
Cela veut dire qu'une fois arrivé dans cet état le processus ne le quittera 
plus jamais. Il est entendu que ce n’est pas l'unique procédé de transforma- 
tion d’une fonction aléatoire markovienne tronquée en non tronquée. 


14.2. Processus markoviens. 
Définition ct propriétés fondamentales 


14.2.1. Définition. On a vu au chapitre 2 qu'il était commode, en étudiant 
la propriété de Markov des processus aléatoires, de ne pas fixer la loi 
initiale (voire même l'instant initial) mais de considérer toute une famille 
de fonctions aléatoires markoviennes « issues » à un instant arbitraire d’un 
point arbitraire de l'espace des phases. Du point de vue de la théorie des 
probabilités cela signifie que sur l’espace probabilisé il existe non plus une 
mesure probabiliste mais toute une famille de mesures P,,, dépendant du 
temps et de la variable de phase et liées entre elles par la propriété de Mar- 
kov. Ceci étant, la mesure P,, est interprétée comme la probabilité condi- 
tionnelle d’un événement susceptible d’avoir lieu après l'instant s sachant 
que Ë(s) = x. Un tel objet est défini de façon unique (à l’équivalence sto- 
chastique près) par la probabilité de passage et, par conséquent, est plus 
commode pour l'étude de la propriété de Markov que la notion de fonction 
aléatoire markovienne. Passons aux définitions exactes. On admettra que 
‘G = [0, cf et on définira d'abord un processus markovien non tronqué. 

Soient donnés : 

a) un espace mesurable ({, ) appelé espace des événements élémen- 
taires ; 

b) une famille de tribus ,,0 = 5 < / «& co, telle que 3, € ÿ; € A 
pour de f\ SS<!/</, So; on conviendra d'écrire #, pour ÿ° et y‘ 
pour 54 ; 

c) une fonction de deux variables &(r) = &(r,w), 1€ ©, EN, à va- 
leurs dans un espace mesurable (X, 8), telle que l'application £(s, -) de 
l'espace (f2, 7) dans l’espace (X, 8) soit mesurable quels que soient 
0O<s<t; on admet que la tribu 8 contient tous les ensembles à un 
point ; 

né famille de mesures probabilistes {P,,, s € ‘©, x € X} sur la 
tribu %’. 

Définition 1. On dira que le système d'objets a) à d) est un processus 
markovien (non tronqué) si sont réalisées les conditions : 


1) /a fonction 
P(s,x,1,1") = P,{4)€ 7) 


est une fonction B-mesurable de x pour tous les 0 = s « /, l'E B, et de 
plus P(s, x, 5, 1) = 414X), où 4r{x) est l'indicateur de l'ensemble T'; 


D PA) € 178) = P(to EH) 
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est P,,-presque sûrement réalisée quels que soient 0=<s<t, <1,,X€X, 
res. 

Le processus markovien est désigné par (£(r), 3, P,,). L'espace 
(X, 8) s'appelle espace des phases du processus, la fonction P(s, x, ?, l'}, 
probabilité de passage. On remarquera que P(s, x, 1, X) = 1 et ainsi qu'il 
résulte de la condition 2) 


Ps, xt 1) = À PS, x, 11 dy) P(, y, 12, 17) 
x 


pour tous les0=s<t,<ta x E X, l'E D, c'est-à-dire la probabilité de 
passage est solution de l'équation de Chapman-Kolmogorov. 

Soit (£(r), S:, P,,) un processus markovien à valeurs dans l'espace des 
phases (X, 8). Désignons par 9! la plus petite tribu des événements ren- 
fermant tous les événements de la forme {£(u) € '} pour u Efs,1], l'EB, 
et par 9° la plus petite tribu contenant toutes les tribus N° pour ? > 5 ; 
comme toujours, on écrira 9, pour 9%. De toute évidence 94 € Yi, 
N° © ÿ'et le processus ((r), N4, P,,) est aussi markovien. 

Les propriétés suivantes du processus markovien découlent immédiate- 
ment de la définition 1 : 

1) la fonction P,(4) est ‘B-mesurable comme fonction de x pour 
tout À EN: ; 

2) la fonction E,,7 est B-m:surable comme fonction de x pour toute 
variable aléatoire 7 bornée (non négative) N'-mesurable ; 


3) P,,(4/91) = Pie(A), s < 1, 
cst réalisée P,,-presque sûrement pour tout À € 9. 
4) E, (7/ ÿ1} un Euh S& /, 


cest réalisée P,,-presque sûrement pour toute variable aléatoire » bornée 
N'-mesurable ;: 


5) si 4 € 5, BE N!, alors 
P,ANB)= | Pau(B)P, (do), 5 <t. 


14.2.2. Extension des tribus fondamentales. Soit (&(r), %f, P.,) un processus 
markovien à valeurs dans l'espace des phases (#, D). Il est possible (et 
souvent utile) d'étendre les tribus fondamentales figurant dans la définition 
d'un processus en préservant la propriété de Markov. L’adéquation d'une 
telle extension est liée au fait que les tribus 9? et %° ne contiennent pas 
de nombreux événements importants du point de vue de la théorie des 
probabilités. Cette extension consiste à compléter les tribus pour des 
systèmes de mesurc. 

Soit y: une mesure finie quelconque sur (#, 8). Désignons par 3, la 
complétude de la tribu 8 pour la mesure y. Cela signifie que 4 € 8,, si 
existent des ensembles 4,, 4, € 8 tels que 4, € À © 4, et 1(4,) = u(A2). 
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Désignons par 8° la tribu, intersection des tribus 8, pour toutes les 
mesures finies 4 définies sur 9. Les ensemlebs de 8° sont dits ensembles 
universellement mesurables, engendrés par la tribu 9. Complétons par 
ailleurs les tribus %* pour la famille de mesure {P,,,u0 æs,x€ X} et 


désignons cette complétude par %'. Cela signifie que 4 € %" si pour tous 
u &s,x € X, il existe des ensembles 4,, 4, € ÿ' tels que P,,(4,) = P,.,(43) 


et 4, € À © A. Supposons que %! désigne la tribu contenant tous les 


événements À € $° tels que pour tous u = 5, x € X, ilexiste un événement 
A1€%:, pour lequel P,,(4 44,) = 0, où 4 44, est la différence symétri- 


que des ensembles À et 4,. Supposons de façon analogue que M désigne 
la complétude de la tribu À: pour la famille de mesures P,, où u «5, 
ge est unc mesure probabiliste arbitraire sur (X, 8) et P.. est définie par la 


formule 
P,,(4) [ = n(dx) PA), AE. 
x 


Désignons enfin par he: la tribu des événements À € Ÿ° tels que pour tous 
u « s et toute mesure probabiliste u sur (X, 8) il existe un événement 
A, € 4 pour lequel P,,(4 44,) = 0. : 

On démontre que pour toute variable aléatoire bornée 9%’-mesurable 
la fonction E,,n est B°-mesurable comme fonction de x, que l'application 
Et, -) de l'espace (0, %) (et par conséquent de l'espace (9, #1), puisque 
M %!) dans l'espace (X, 8°) est mesurable pour tous les s «#. De 


plus, la relation : 
P,(4/ &:} se Peu (4) 


est P,,-presque sûrement réalisée pour tous les s = 1 ct 4€ ge, 


Donc le processus (£(r), %?, P,.) est un processus markovien à valeurs 
dans l'espace des phases (X,%*). Donc on pourra toujours, si cela est 


commode, considérer que 3 = B°, % = %e, À: = %. 


14,2.3. Conditions de régularité. Soit (E(r) %4, P,,) un processus markovien 
à valeurs dans l’espace des phases (X, 3) défini sur l'espace des événements 
élémentaires (92, Ÿ). Fixons un 5, > 0, et soit # une mesure probabiliste 
sur (X, 8). Considérons une fonction aléatoire {£(f), t = s,} subordonnée 


au flot de tribus {gp ‘ = 5} et définie sur l'espace probabilisé (9, h', 
P,,) Où 


Set 


P,,(4)= [P, AA) u(dx),  AER*. 
x 


Il est immédiat de voir que c'est unc fonction aléatoire markovienne 
définie pour t > s, de loi initiale ys et dont la probabilité de passage P(#,, x, 
t, l) est confondue avec celle du processus markovien (Ë(r), AE P,s): 
Si donc l'on possède un processus markovien, on peut construire une 
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infnité de fonctions aléatoires niarkoviennes en choisissant l’origine du 
temps et en se donnant la loi initiale. On dira que deux processus marko- 
viens à valeurs dans un même espace des phases (définis éventuellement sur 
des espaces probabilisés différents) sont équivalents si les fonctions aléatoires 
markoviennes construites d’après ces processus avec une même origine du 
temps et une même loi initiale sont stochastiquement équivalentes (c'est-à- 
dire si elles possèdent des lois finidimensionnelles identiques). Il en résulte 
qu'une condition nécessaire et suffisante pour que des processus marko- 
viens soient équivalents est que leurs probabilités de passage soient con- 
fondues. Un processus markovien est défini de façon unique à l’équivalence 
près par sa probabilité de passage. On peut se demander s’il existe toujours 
un processus markovien possédant une probabilité de passage donnée. 
La réponse à cette question est fournie par le théorème suivant. 

Théorème 1. Soient X un espace séparable métrique complet (polonais ), 
8 Ja tribu de ses boréliens, © = [0, [. Supposons qu'est donnée une fonc- 
tion P(s,x,1,1),0æ&sæ<t<o,x€X, TES, vérifiant les conditions : 

D) P(s, x, 1, T) est B-mesurable pour 5, t, T' fixes : 
f 2) P(x, 5,1t,T) est une mesure probabiliste sur (X, 8) pour 5,1, x 

xes ; 
3) pour tous les xEX,0<=s<ti=<ts< 0, 


P(s, an ER r”) = [P6, X, LT dy) P(t5, y, Le, D. 
Ad 


Il existe alors un processus markovien (non tronqué) à valeurs dans 
l'espace des phases (X, 8) dont la probabilité de passage est P(s, x, 1, l). 

Il est entendu que dans la définition du processus markovien, de même 
que dans ce théorème, l'ensemble “© peut être un intervalle fini ou même 
un sous-ensemble de l’ensemble [0, cf. 

On peut naturellement se poser la question de savoir sous quelles 
conditions imposées à la probabilité de passage il existe parmi des processus 
markoviens équivalents un processus dont les réalisations ou les trajectoires 
(c'est-à-dire les fonctions &(f, w) traitées comme fonctions de ? pour w fixe) 
possèdent telle ou telle propriété de régularité, par exemple, sont conti- 
nues, possèdent des limites à gauche, etc. Avant de répondre à cette question 
on donnera quelques définitions. 

Définition 2. On dit qu'un processus markovien (£(r), #3, P,,) à valeurs 
dans un espace des phases métrique (X, 8) (8 est la tribu des boréliens 
de X) est continu (resp. continu à droite) si ses trajectoires sont P,,-presque 
sûrement continues (resp. continues à droite) quels que soient s = 0 et 
x € X pour tous les # > s. 

Définition 3. On dit qu’un processus markovien (£(r), 35, P,.) ne 
possède pas de discontinuités de seconde espèce si ses trajectoires ne pos- 
sèdent P,,-sûrement pas de discontinuités de seconde espèce pour tous 
less=0,xelett>s. 

Désignons par U,(x) la boule de X de rayon & et de centre x et posons 
U,(x) = X \U, (x). 
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Thévrème 2. Soit (Ë(1), %r, P,,) un processus markovien à valeurs 
dans l'espace des phases (X, B), où X est un espace métrique séparable 
localement compact complet, 5, la tribu des boréliens de X, de prohabilité 
de passage P(s, x, 1, l). 

D) Si 

lim sup P(s,x,1, U,(x)) = 0 
010 O<s<i<s+0 
zecx 


alors le processus (E(r), %!, P,,) est équivalent à un processus markovien ne 
présentant pas de discontinuités de seconde espèce et continu à droite. 


Si 
lim 9-! sup P(s, x, 1, U,(x)) = 0, 
840 O<ssi<tr0 
rer 


alors le processus (Ë(r), %, P,.) est équivalent à un processus markovien 
contintt. 


14.2.4, Propriété de Markov forte, Soit (£(r), %!, P,.) un processus markovien 
à valeurs dans l'espace des phases (X, 3). La variable aléatoire r = r{(w) 
à valeurs dans [s, œ] sera appelée temps d'arrêt par rapport au flot de 
tribus {3 1 = s} (4, > 5}, (9, r > s}), si pour tous les 1> 5 
est réalisée la condition {w : r(w) < 1} € % ({w : 7(o) <1} EN, {w : 
T(w) <1}EŸ). On dit parfois que les temps d'arrêt sont des quantités 
ne dépendant pas du futur, puisque la condition b < 1}€ Yi signifie 
manifestement que l'apparition ou la non-apparition de l'événement {7 < t} 
ne dépendent que des événements observés pendant l'intervalle séparant 
l'instant s de l'instant s. 

__ A tout temps d'arrêt 7 par rapport au flot gi, 1 > 5} (49H, 1 > 5}, 
{sis t=> s}) on peut associer une tribu %:(9:, 2) définie comme l'en- 
semble de tous les 4 € %'(4 € N°, A EN) pour lesquels ANf{r <1}eÿ 
quel que soit 1€ {s, [ (4 N{r &<1}EN,, AN(r =<!t}e 9). 

La quantité r est manifestement %-mesurable, et si 7, et r. sont 
deux temps d'arrêt par rapport au flot {%f, : = s} tels que {r, = r,}, 
alors %,, € 

Il est souvent nécessaire de considérer la valeur prise par une fonction 
aléatoire &(r) à un instant aléatoire r. Pour obtenir une variable aléatoire, 
il faut que la fonction £(r) soit mesurable (comme fonction de #). Si, de 
plus, l’on désire que Ë(r) soit %-mesurable, il faut alors exiger la mesu- 
rabilité progressive du processus £(r). 

Définition 4. On dit qu'un processus markovien (£(r), %f, P,,) à 
valeurs dans un espace des phases (X, 8) est progressivement mesurable 
si l'application ë(u, w) de l'espace ([s, 1]X9, "C1 X %!) dans l'espace (X, 3) 
est mesurable pour tous s, ? (0 <& 5 < 1 < ©), "O4 est la tribu des boréliens 
de l'intervalle [s, #]. 
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On remarquera que si le processus (£(r), %, P.) est continu, il est 
progressivement mesurable. Si un processus markovien est progressive- 
ment mesurable et + est un temps d'arrêt fini par rapport au flot 
{%!, 1 > s}, alors l'élément aléatoire £(r) = £(r(), w) à valeurs dans (X, 8) 
est G:-mesurable. Si, de plus, {r,, t = s} est une famille de temps d'arrêt 
finis par rapport au flot (Gi, tæs}etr,est une fonction de # continue 
à droite monotone non décroissante pour « fixe, alors le processus aléa- 
toire 7(t) = Ë(7(w), w) sera progressivement mesurable par rapport au 
flot de tribus (5, 1æs}. 

Voici maintenant la définition d’un processus markovien fort. 

Définition 5. On dit qu’un processus markovien progressivement 
mesurable (£@), ®!, P,) à valeurs dans l'espace des phases (X, 8) est 
markovien fort si sont réalisées les conditions suivantes : 

1) la probabilité de passage P(s, x, ?, 1”) du processus est une fonction 
de (s, x, 1) XD x C°-mesurable sur l’ensemble 0 &sæ</<oo,\EX, 
pour l'E # fixe ; “C? est la tribu des boréliens de [0, cf ; 

2) quels que soient s> 0,1 0,x€X, l'EB et un temps d'arrêt 
Tr par rapport au flot de tribus {%2, u = 5) 


P {EG + Tr) € T7?) = Pr, En), 1 +7, 17) 


P,,-presque sûrement sur l'ensemble 92, = {« : T(&) = }. 

On remarquera que dans le cas particulier où 7{(w) = f/,, c'est-à-dire 
lorsque 7(w) n'est pas aléatoire, la condition 2) de la définition 5 est con- 
fondue avec la condition 2) de la définition 1. La notion de processus 
markovien fort distingue parmi les processus n'arkoviens ceux qui pos- 
sèdent la propriété de Markov à des instants aléatoires, plus exactement 
à des temps d'arrêt. 

Si (£(r), %!, P,,) est un processus markovien fort et f(x, V2, ..., X,), 
Nip No. X € À, est une fonction réelle W"-mesurable et bornée, alors 
la relation 

FE, {Er +4), Er +0), ….., Er +4,))/3t} = 
= En / (Er +0), Er +12), .….., Er +1,))} 


P,,-presque sûrement sur l’ensemble 92, = {r < } cst réalisée pour tout 
temps d'arrêt 7 et tous les #,, f2, ...,/, positifs. Ceci étant, le second membre 
doit être compris ainsi : posons 


hs, X lu LEA .. 1) = E,,/(ë(r), Es), .. Ë(r,)), 
OÙUXE#, s = min(f, 2, ..., 1,). AlOrs 
Er) / (ET +1), ET +12), .. ET +1,)) — 
= N(r, Er), T4, T4 ..., TH). 


Formulons maintenant la propriété de Markov forte d’un processus. 
Pour cela, définissons tout d’abord l'opérateur R1, À > 0, agissant sur la 
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fonction mesurable bornée réelle f(1, x), 1€ (0, of, x € X, à l’aide de 1 
formule 


(RN(s,,X)=E, Î e-A(s+s, £(s+r)) dt. 


On démontre que si la probabilité de passage P(s, x, ?, [") pour T° 
fixe est une fonction mesurable de (s, x, f), alors la fonction (R1/) (s, x) est 
mesurable en s, x et bornée quels que soient À = Oet la fonction mesurable 
bornée f(s, x). 

Théorème 3. Soient X un espace métrique, 8 la tribu des ensembles 
universellement mesurables de l'espace X. Soit donné un processus markovien 
(EG), $?, P..) à valeurs dans l'espace des phases (X, 8) vérifiant les condi- 
tions : 

a) Ja probabilité de passage P(s, x, t, l°) est mesurable en s et x pour 
tet l'fixes ; 

b) les trajectoires du processus (c'est-à-dire les fonctions E(r) traitées 
comme fonctions de t,t > s) sont P,,-presque sûrement continues à droite 
quels que soient s = 0,xE€ X ; 

c) les trajectoires du processus (Rif) (+, E(r)), t = 5, sont P,,-presque 
sûrement contintes à droite quels que soient s = 0, x € X et la fonction 
continue bornée f(x). 


Alors le processus (£(r), %!,, P..) est markovien fort (6. = f\ ge) : 
s>0 


14.2.5. Processus standards, La définition suivante distinguc une classe 
de processus markoviens possédant de « bonnes » propriétés. 

Définition 6. On dit qu'un processus markovien (£(r), %:, P,,) à 
valeurs dans un espace des phases (X, 3), où X cst un espace métrique 


compact local ct 8 la tribu des boréliens de X#, est standard si sont réali- 
sées les conditions suivantes : 

1) &! = '4 = F! pour tous les s, 1 (0 & 5 < ! < co) ; 

2) le processus (£(r), %!, P,,) est continu à droite et possède des 
limites à gauche (cf. définition 2) ; 

3) le processus (£(r), %{, P,.) est markovien fort ; 

4) le processus (£(r), &?, P..) est quasicontinu à gauche ; ceci signifie 
que lim é&(r,) = ë( Jim ta) P,,-presque sûrement sur l’ensemble 


mn —+> 00 


{o : Jim T, < œ} quels que soient s > 0, x € X et la suite non décrois- 


Nm —& O0 


sante des temps d'arrêt r,, # = 1,2, ... par rapport au flot {4,1 > 5). 


Citons maintenant les conditions que doit remplir la probabilité de 
passage pour qu'existe un processus standard admettant cette probabhilité 
de passage. Définissons préalablement la probabilité de passage fellérienne. 
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Soient X un espace métrique localement compact séparable, 8 la 
tribu de ses boréliens, P(s, x, ?, 7") une probabilité de passage dans (X, B), 
c'est-à-dire une fonction satisfaisant les conditions du théorème 1. Dési- 
gnons par Co(X) l'ensemble de toutes les fonctions continues réelles définies 
sur * et tendant vers 0 lorsque x quitte tous les compacts contenus dans X. 
Ceci signifie que pour tout & = 0 il existe un compact X, © X tel que 
f(x)! < 8 pour tous les x € X\K,. A noter que si X est un compact, Co{X) 
est confondu avec l’ensemble de toutes les fonctions continues À valeurs 
réelles définies pour x € X. 

Définition 7. On dit qu’une probabilité de passage P(s, x, t?, l') est 
fellérienne si sûnt remplies les conditions suivantes : 

1) la fonction 


(Tuf) (x) = j# Cyr) Ps, x, 1, dy) 


est continue en l'ensemble des variables (s, #, x), 0 &s «1, x € X quels 
que soient s, (0 «& s < t < œ)et f ECUX) ; 
2) pour toute fonction SE C(X) 


lim sup |(7,,/) (x)—/(x)l = 0. 
t$s Cr 


Théorème 4. Si P(s, x, !, l') est une probabilité de passage fellérienne 
dans un espace métrique localement compact séparable (X, 8) il existe alors 
un processus mmarkovien standard de probabilité de passage P(s, x, t, l”). 


14.2.6. Processus tronqués. Voici la définition d’un processus markovien 
(ronqué. Soient donnés : 

a) un espace mesurable (92, 9%), appelé espace des événements 
élémentaires ; 

b) une variable aléatoire {(w), à valeurs dans l'intervalle achevé 

, ©]; 

c) des tribus %; © À dans l'espace 92, = {w : /(w) — 1} pour chaque 
s,1,0<sæ<t, telles que si s<t1eu et AE, alors AND,E XL : 

d) une fonction de deux variables £(r) = &(t, ©), 1 € [0, C(w)[, w € 9, 
à valeurs dans un espace mesurable (X, 3), telle que l'application &(7, :) 
de (9,, &:) dans (4, %) soit mesurable pour tous 0 æ& s & f ; on admet 
que la tribu 8 contient tous les ensembles à un point ; 

e) des mesures probabilistes P,, sur la tribu %'=%% pour tous 
less >= 0,x€ X. 

Définition 8. On dira que le système d'objets a) à €) est un processus 
markovien (tronqué) si sont réalisées les conditions suivantes : 

1) /a fonction 


P(s, x,1, 1") = P,(ÉO € 1} 


est S-mesurable en x pour tous Oss<«t, l'E, et de plus 
Ps, x, 5, X\{x}) = 0 ; 
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2) la relation 
P, {6(2) ETS} = P(fu 8h) ta D) 


est P,,-presque sûrement réalisée sur l'ensemble 2, pourtous0 <s &<t, = t,, 


xexX, TER. 

L'instant & est appelé temps d’arrêt. On désignera par (£(r), &, %!, P,,) 
tout processus markovien tronqué. Il est évident que si £(@) = + co, la 
définition 8 se transforme en la définition 1 d’un processus markovien 
non tronqué. 

La fonction P(s, x, ?, l") définie dans la condition 1) de la définition 
8 s'appelle probabilité de passage du processus markovien. La condition 
2) entraîne qu'elle vérifie l'équation de Chapman-Kolmogorov. Il importe 
de se rappeler seulement que P(s, x, ?, X) = 1 et que 1—P4(s, x, ?, X) est 
la probabilité qu’en quittant le point x à l'instant s le processus s'arrête 
à l'instant r. 

On dit que la probabilité de passage P(s, x, ?, l') est normale si 
P(s, x, st, X) = lim P(s, x, 1, X) = 1 pour tous les s> 0 et xe X. 


the 
L'existence de cette limite résulte de l'inégalité (s = #, < 2) 
P(s, x, 12, X) = f Ps, x, ta, dy) P(t,, v, tas À) Æ Ps, x, 11, À), 
ï 


qui signifie que P(s, x, ?, X) est monotone non croissante comme fonc- 
tion de ? pour t = 5. 

Un processus markovien à probabilité de passage normale est dit 
normal. 

Les nombreux résultats obtenus pour les processus markoviens non 
tronqués s'étendent sous certaines restrictions aux processus tronqués. 
L'’analogue du théorème 1 est par exemple le 

Théorème 1’. Soient X un espace métrique complet, 8 la tribu de ses 
boréliens. Supposons que la fonction P(s,x,1,7),,0<sæ<t<o, xeX, 
T'EB vérifie les conditions 1) et 3) du théorème I et la condition : 2’) 
P(s, x, 1, T) est une mesure (pas nécessairement probabiliste) sur (X, 8) pour 
5, X, t fixes, et de plus P(s, x,1t, 1") = Let P(s,x,s*, X) = 1. 

Il'existe alors un processus markovien normal à valeurs dans l'espace des 
pliases (X, 8) de probabilité de passage P(s, x, t, D”). 

Les processus possédant une même probabilité de passage sont dits 
équivalents. Si l’on construit des fonctions aléatoires markoviennes (tron- 
quées) d’après des processus équivalents, comme dans le numéro 14.2.3, 
clles seront stochastiquement équivalentes (c'est-à-dire auront les mêmes 
lois finidimensionnelles). 

La définition d’un processus tronqué markovien fort est la même que la 
définition 5 à la seule différence que la relation de la condition 2) doit être 
réalisée P,.-presque sûrement sur l’ensemble 9, = {ow : t(w) < &(w)}. 

La définition d'un processus markovien tronqué standard est en tout 
point analogue à la définition 6. On se rappellera seulement que les fonctions 
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(1) étant données uniquement sur un intervalle ouvert [0, ê[, la continuité à 

droite du processus, de même que l'existence des limites à gauche sont envi- 

sagées pour les points # € {0, €. | 
De façon analogue, dans la définition de la quasi-continuité à gauche la 


relation lim ë(r,) = £l lim a) doit être satisfaite P,,-presque sûre- 


nm —+ © nm —> © 


ment sur l'ensemble {w : lim +, < &(w)}. 

Le théorème suivant donne les conditions d'existence d'un processus 
standard tronqué. 

Théorème 5. Séient X un espace métrique complet séparable localement 
compact, 8 la tribu de ses boréliens, P(s, x, t, 1") une probabilité de passage 
normale (c'est-à-dire une fonction satisfaisant les conditions du théorème 1”). 
Supposons que sont remplies les conditions : 

1) /a fonction 


(Tuf)O)= (P(s, x, 1, dy)fO), sæ«t, xEX, 
4 
possède la propriété suivante de continuité 
lim (7, f)@) = (TZ, 


sl 


1) 


quelle que soit la fonction bornée continue f(x), x € X, à valeurs réelles : 
) lim sup P(s,x, 1, U(x)) = 0, où U,(x) est une boule dans 
840 rt 
X de centre x et de rayon e, U,(x) = X\U, (x). 
Il existe alors un processus markovien standard normal de probabilité de 
passage P(s, x, t, 1”). 


14.3. Fonctionnelles multiplicatives 
de processus markoviens 


14.3.1. Définition et propriétés. Soit (£(r), 6, %?, P..) un processus marko- 
vien à valeurs dans l'espace des phases (#, B). 

Définition 1. On dit qu'une famille de variables aléatoires à valeurs 
réelles « = a/(w), 0&s=<1/, ES, est une fonctionnelle multiplicative 
d’un processus markovien si sont remplies les conditions suivantes : 

a) la variable aléatoire a! est 9-mesurable ; 

b) pour tous les x € X,0=& s"&/ &uona P,,-presque sûrement sur 
l'ensemble (2, 

af = 4 ; 
c)0 & a; & 1 pour tous 0 & 5 & /, & E 2, 
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On dit qu’une fonctionnelle multiplicative est continue à droite si 


lim a’ = a; P,,-presque sûrement sur l'ensemble 92, pour tous les 1 > 5 æ 0, 
init 


xEX. 
Citons un exemple de fonctionnelle multiplicative. Supposons qu'un 
processus markovien est progressivement mesurable par rapport aux tribus 


h; (cela signifie que dans la définition 4 du numéro 14.2 on peut remplacer 


la tribu %: par la tribu Ÿ; et A par (,). Soit w(s, x) une fonction non néga- 
tive mesurable en (s, x) € [0, [XX X. Posons 


aÿ = exp _f v(u, ë(u)) a) 0OÆsæ<t, ES, 


Si l'intégrale de cette formule est finie pour tous les 0 <& s «< ? < &(w), 
alors a$ est une fonctionnelle multiplicative du processus &(#). On l’appelle 
fonctionnelle multiplicative de type intégrale. On remarquera qu'une telle 
fonctionnelle est continue pour tout # > 5, w € f2,. 

Soient «? et B: des fonctionnelles multiplicatives d’un processus mar- 
kovien (£(r), €, &%?, P..). On dit qu'elles sont stochastiquement équivalentes, 
si Pfoi # P:} = 0 pour tous less = 0,xE€ X,t > 5. 

Il résulte de la définition que si «? est une fonctionnelle multiplicative, 
alors «! = (a«!)?, de sorte que «! ne peut prendre que deux valeurs : Oet 1. 
De plus, P,,{x! = 1} = O ou 1,ce qui découle de la loi de tout ou rien suivante. 

Loi de tout ou rien. Si À € M, alors P,,(A) = 0 ou 1. 

Etant donné s, désignons par X{ l’ensemble de tous les x € X tels que 
P,,{x? = 1} = 1. De toute évidence X’ € 8. Posons 


F(s, X, f, r) a E,.xr(é()}, 


Où0&sæs/<o,xE X, l'E B, yr(x) est l'indicateur de l'ensemble 7". 
Ilest immédiat que la fonction P(s, x, ?, l')est une mesure sur $ pour s, x, t 
fixes, et S-mesurable pour s, ?, l'fixes. De plus, elle est solution de l'équation 
de Chapman-Kolmogorov : 


P(s, x, la r) = f P6, X, lu dy) P(t,, Vs LT D, 
z 


0OÆs<ti<ty XEX, res. 
Ceci étant, 
Ps, x,1, 7) = P(s,x,1, 0), (3.1) 
où P(s, x, t, l') est la probabilité de passage du processus (£(r), &, %?, P..). 
Si ce processus est normal, alors 
P(s, x, 5, T)= rh PAG) 
Donc, toute fonctionnelle multiplicative d'un processus markovien 


engendre une probabilité de passage P(s, x, ?, 1") vérifiant l'inégalité (3.1). 
Ceci étant, pour que deux fonctionnelles multiplicatives soient stochasti- 
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quement équivalentes, il faut et il suffit qu'elles engendrent la même proba- 
bilité de passage. | | 

Le théorème suivant montre que sous certaines conditions toute pro- 
babilité de passage vérifiant l'inégalité (3.1) est engendrée par une fonction- 

lle. 
di Théorème 1. Soient donnés un processus markovien normal (E(r), &, %!, 
P,.) à valeurs dans un espace des phases (X, 8) de probabilité de passage 
P(s, x, t, D) et une probabilité de passage P(s, x, 1, [°) vérifiant l'inégalité 
(3.1). Supposons que sont remplies les conditions : 

1) /a tribu 8 est engendrée par une famille dénombrable de sous-en- 
sembles de À; 

2) il existe sur (0, [ un sous-ensemble J dénombrable partout dense tel 
que les tribus R sont engendrées par les événements de la forme {Ë() € T } 
pour u € JNS, 1], T'ES. 

Il existe alors une fonctionnelle multiplicative « du processus (E(r), &, 


s P,,) telle que 
ne Ps, x, 1, 1) = E,;7r (80) }e. 


En outre, si le flot de tribus (9%, t= s} est continu à droite (ce qui équi- 
vaut à M, = Ÿ) et la fonction P(s, x, 1, X) est également continue à droite 
en t au point t = s pour tous les s et x, alors la fonctionnelle multiplicative 
« peut être définie de façon à être continue à droite. 

Remarque. Les conditions 1) et 2) du théorème sont satisfaites si 
X est un espace métrique séparable, 8, la tribu des boréliens de X et le pro- 
cessus (Ë(r), &, 7, P,.) continu à droite. 

En conclusion de ce point, indiquons une équation intégrale qui est 
vérifiée par la probabilité de passage P(s, x, ?, l”) si celle-ci est engendrée par 
une fonctionnelle de type intégrale. 

Soit u(s, x) une fonction non négative mesurable en s et x, définie pour 
sæ0,x€e X. Posons 


a = EXP _ f v(u, E(u)) 4) 


pour 0&=sæ<f,&€,= {o: E(o) = 1}. On admettra que l'intégrale de 
cette formule est finie pour tous les 0 <& s  ? < 6(o). Si 


P(s, x, 1, 1) = E,yr(E()}e, 


alors la fonction P(s, x, #, 1”) est solution de l'équation intégrale 


P(s, X, Î, Tr) — P(s, X; {, n-f fP6, X, U, dy) v(u, }) P(u, 2 {, 1) du. 
CR « 


14.3.2. Sous-processus. Soient donnés deux processus markoviens : 


(EG), &, 31, P..) et (EG), &, &t, P.) à valeurs dans l'espace des phases (X, 8) 
définis sur le même espace d'événements élémentaires £2. Soient réalisées 
les conditions suivantes : 
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a) É(o) & &(œ) pour tout & € 9 ; 

b) Éte) = E(r) pour 0 & 1 < Ë(w) : 

c) & = YO), où 9, = {o : E(@) > tr} et GA] est la trace de la 
tribu %? dans l’ensemble 9, c'est-à-dire l'ensemble des événements de la 
forme ANG, À € %. 

On dit alors que le processus (Ë(e), ë, &,, P,) est obtenu par réduction 
de la durée de vie du processus (£(r), &, &f, P..). 


Définition 2. Un processus markovien (Ë(r), &, &!, P,.) est sous-pro- 
cessus du processus (£(r), &, &:, P.,) s’il peut être obtenu par réduction de la 
durée de vie d'un processus équivalent à (£(r), 6, !, P..). 

Si P(s, x, 1, l') est la probabilité de passage du processus markovien 
(EG), &, &1, P,.) et Ps, x, t, 1”) la probabilité de passage d’un de ses sous- 
processus, alors manifestement 


P(s, x, 1, 1) & P(s, x, 1, D). 


Par suite du théorème 1 il résulte le 
Théorème 2. Si un processus markovien (E(r), &, %?, P,.) vérifie les con- 


ditions du théorème 1 et le processus (Ë(r), ë , &, P..) est son sous-processus, 
alors la probabilité de passage P(s, x, t, [") du sous-processus est engendrée 
par une fonctionnelle multiplicative a; du processus (£(r), &, %f, P..) en ce 


sens que 
P(s, X, /, Là Eu E,,/r (y. 


La réciproque est vraie dans un certain sens. 
Théorème 3. Soit «? une fonctionnelle multiplicative continue à droîte 
d'un processus markovien normal (£(r),&, Sf, P..). 1 existe alors un sous- 


processus (COX Ë, &, P,) de ce processus dont la probabilité de passage 
s, x, !, l'est engendrée par la fonctionnelle a}, c'est-à-dire 


Ps, x, 1, 7) = EE) = Er) }t 


pour tous ls0&s<«t,xE X, TES. 
Si P,.{ai = 1} = 1 pour tous les s æ Det x € X, alors le sous-processus 
mentionné est normal. 2e. 
Considérons maintenant un sous-processus (£(r), , %, P,,) du pro- 
cessus (£(#), &, &?, P,.) engendré par une fonctionnelle multiplicative de 
type intégrale 


4 
a! = Exp _ f v(u, Ë (u)) 7 
de fonction v(u, x) non négative mesurable bornée, Alors 
Ps, x, t, X) = Eat. 
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Posons #{ = s+/et soit A} 0. On aura aux infiniment petits d'ordre supéricur 
s+h 
P(s,x,5+h0,X)—P(s,x,5+h, X) SE, f vu, EG) du. 


Supposons que la fonction v(w, £(u)) cst continue à droite et que le 
processus cst normal ; alors pour h}0 


P(s,x,s4+h, X)—P(s,x, 54h, X) #8 os, hi 


aux infiniment petits près d'ordre supérieur. Si le sous-processus (ét), F, 
&, P,,) est obtenu par réduction du temps de vie du processus (£(), €, 
®', P.), alors le premier membre de la dernière relation peut se mettre 
sous la forme 

P,{È <s+h <t}, 


ce qui représente la probabilité que le sous-processus Ë(r), en sortant de 
l'état x à l'instant s, s'arrête avant l'instant s +, contrairement au pro- 
cessus Ë(r) qui, lui, ne s'arrête pas avant cet instant. 


Chapitre 15 
PROCESSUS MARKOVIENS HOMOGÈNES 


15.1. Définition ct propriétés fondamentales 


15.1.1. Définition. On peut sc représenter intuitivement un processus 
markovien homogène comme un processus dont les passages d’un état x à un 
ensemble d'états J'entre l'instant s et l’instant s+ 4 ont lieu avec une pro- 
babilité ne dépendant pas de s. Ceci signifie que la probabilité de passage 
P(s, x,t, 1”) d'un processus homogène doit être telle que la fonction 
P(s, x, s+ h, T) ne dépend pas de s. Si nous posons P(h, x, 1) = P(s, x, s+ 
+ h, l), alors on aura pour les lois finidimensionnelles du processus 


PE) € D, ..., 80) ET} = 


= fPG=—S, Y, dy) CRU Ju dy) … [Pat Yn= 1 dn) = 
r, T T 


= P{é(-5)€17",...,46(4,-—5) ET), 
O<s<ti<t;<...<t, 


Donc, au lieu d'une famille de mesures P,, dépendant des variables tem- 
porelle et spatiale, dans le cas homogène il suffit de considérer une famille de 
mesures P, = P,, dépendant seulement de la variable spatiale. En d’autres 
termes, toutes les fois que le processus quitte l'état x à l'instant s, nous 
effectuons une translation du temps pour recaler s en l'origine. Naturelle- 
ment on doit avoir la possibilité de déplacer respectivement toutes les 
trajectoires du processus, ce qui signifie que l’espace des événements 
élémentaires doit être assez riche. 

Voyons maintenant la définition exacte. Soient donnés : 

a) un espace d'événements élémentaires (Q, 9) ; 

b) une variable aléatoire &(w) à valeurs dans |” intervalle achevé [0, |] ; 

c) une tribu %, dans l'espace 9, = {w : (w) = t} pour tout r > Oet, 
de plus, si s << ?, alors %[92,] € %, € À, où [0,1 est la trace de la tribu 
Y. sur l'ensemble £2,, c'est-à-dire la famille de tous les ensembles de la 
forme ANS, A EY%, : 

d) une fonction de deux variables &(r) = &(r, w), 1 € [0, É(o)[, © € 92, à 
valeurs dans un espace mesurable (X, 3), telle que l'application &(s, -) de 
l'espace ((,, %,) dans l'espace (X, 8) soit mesurable pour tout f >= 0; on 
admet que la tribu 8 contient tous les ensembles à un point. 

e) pour chaque x € X une mesure probabiliste P, sur une tribu % dans 
l’espace 2, renfermant tous les %,, ? = 0. 

Définition 1. Le système d'objets a) à e) forme un processus markovien 
lomogène si sont remplies les conditions : 
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1) pour tous t æ 0, T'ES la fonction 
Pt, x, 1) = P{E() € 17) 


est B-mesurable comme fonction de x et, de plus, P(O, x, X\{x}) = 0 ; 
2) pour tous 5, t >= 0, l'EB, .. 


PAG +S) € 173,3 = PQ, Es), 1”) 


P,-presque sûrement sur l'ensemble S, ; 

3) pour tout wEN, il existe un w°'EQ tel que E(w’) = E(w)—t et 
Es, o°) = E(s+1, w) pour 0 & s < (a). 

La condition 2) regroupe la propriété de Markov d'un processus et la 
propriété d'homogénéité dans le temps. La condition 3) signifie grosso modo 
que toute portion de trajectoire du processus est au bout d'un certain temps 
trajectoire éventuelle. En étendant, au besoin, l'espace 2, on peut toujours 
faire en sorte que la condition 3) soit réalisée. 

La fonction P(?, x, 1”) définie dans la condition 1) s'appelle probabilité 
de passage. De 2) il résulte qu'elle vérifie l'équation de Chapman-Kolmo- 
gorov 


P(s+1,x,1')= [P(s,x, dy)PG,y,T), 5, 120, \EX, T'ES. 
x 


De plus, P(s, x, X)< 1. Si P(+0, x, X) = lim P(1, x, X) = 1, alors la 
1,0 


probabilité de passage est dite normale et le processus correspondant, pro- 
cessus normal. 

On désignera un processus markovien homogène par (&(r), &, %:, P,). 
Si Ê = +00, on dit que le processus est non tronqué cet on le désigne par 
(E(r), Sr P,). Pour tout processus non tronqué P(#, x, X) = 1. 

Désignons par %° Ja plus petite tribu de sous-ensemble de {2 contenant 
tous les ensembles de la forme {£(r) € 7} pour # > 0, l'E 3, et par %, la 
plus petite tribu de sous-ensembles de 2, contenant tous les ensembles de la 
forme {£(s) € 1)N9, pour s € [0, 1], T'ES. 

Supposons que À désigne la trace de la tribu 9° sur l'ensemble 
Do = & > 0}. De toute évidence, R € N° € FH, N, € Y, et le processus 
(EG), 4, N,, P,) sera aussi processus markovien homogène (#(r), &, S:, P;). 

Comme indiqué au numéro 14.2, les tribus 9?, peuvent ne pas contenir 
de nombreux ensembles importants. Par exemple, l'ensemble {w : &(s) € 
pour tous les s € {u, t]} peut ne pas appartenir à %,, puisqu'il est l’inter- 
section d’un nombre non dénombrable d'ensembles cylindriques. Cependant 
les ensembles de cette nature sont souvent contenus dans l'intersection des 
complétions de la tribu N, pour le système de mesures P,. Désignons 


cette tribu par À,. Dans la suite on admettra que Y, = K, ou Y, — h.. 

15.1.2. Processus markoviens équivalents. Si l’on dispose d’un processus 
markovien (£(r),6, R,, P,)(on omettra souvent le terme «homogène » car il 
sera toujours question de tels processus) et d'une mesure probabiliste y: sur 
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unc tribu %%, on peut construire une fonction aléatoire markovienne (cf. 
numéro 14.1) é(r), 1 € [0, [, de durée de vie #, de flot de tribus HN, et de 
mesure P,(4) À € %, définie par la formule 


P,(4) = [r(dx) P,(A). 
X 


(On remarquera que de la condition 1) de la définition 1 il résulte que pour 
tout 4 € N° la fonction P,(4) est B-mesurable). Les lois finidimensionnelles 
de cette fonction aléatoire sont de la forme 


PA(E() € Ti EC) € Ta, EU) ET} = 
= (| (dx) [ PG, À dy) [P@-1, J'19 dJ'2) …. (| Ps fn 10 Va 1 Ya), 
x r, Tr, Th 


où0O<r,<...<1, l,...,1, €, ct P(4, x, D) est la probabilité de 
passage du processus (£(r), &, R,, P,). La mesure # s'appelle loi initiale de la 
fonction aléatoire construite. Si deux processus markoviens possèdent la 
même probabilité de passage, les fonctions aléatoires markoviennes corres- 
pondantes possédant la même loiinitiale sont stochastiquement équivalen- 
tes (c’est-à-dire possèdent des lois finidimensionnelles identiques). Les proces- 
sus markoviens de même probabilité de passage sont dit équivalents. Le 
théorème 1’ du numéro 14.2 nous dit qu'on peut construire un processus 
markovicn homogène d’après une probabilité de passage homogène nor- 
male quelconque. Ceci étant, par probabilité de passage homogène dans 
l'espace des phases (X, 8) on comprend une fonction P(?, x, 1”), t > 0, 
xEX, T'EB, mesure en l'à t, x, fixes (P(1, x, X) = 1, P(O, x, X\{x}) = 0), 
B-mesurable de x à #, l' fixes vérifiant l'équation de Chapman-Kolmogo- 
roy. 


15.1.3. Opérateurs de translation. Définissons l'opérateur de translation 
0,, t æ 0, des ensembles de la tribu 9%. Pour les ensembles de la forme 
{o : HET}, s2> 0,1" CE À, posons 


O0, {Ë(s) € 7} = {EG +5) € T1. 


Exigeons, de plus, que les opérateurs 0, conservent toutes les opérations 
ensemblistes. Ceci définit de façon unique l’action de l'opérateur 0, sur 
tout ensemble 4 € R.' Par exemple, 0,9, = 2,,,, et les ensembles cylindri- 


ques 
(«DE ..., EG) ET,} 
se transforment par l'opérateur 0, en les ensembles 
(£G +)€T, RC | EG, +1) € T,}. 


On peut définir les opérateurs 0, sur des fonctions %-mesurables de «w. 
Plus exactement, supposons que (8,7) (w) = a, si € 0, {n = a). De toute 
évidence 0,0,7 = 0,,,n, de sorte ‘que les opérateurs 0, forment un semi- 
groupe. En particulier, 04 = {—1 pour w € 4,. 
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En termes d'opérateurs /, la condition 2) de la définition 1 devient 
P,{9,50) € 15) = Peut) €} 


P,-presque sûrement sur l’ensemble 2. 

Les propriétés suivantes du processus markovien (£(1), £, #,, P,) sont 
des conséquences simples de la définition 1. TS) 

D) Si 4 EN, alors 7 


P,{0,A/X,} = Peu(A) (P,-p.s. sur (2,). 
2) SiA EN, BE, alors 
P{4N0,B} = [ Pau(B) P,(du). 
A 


3) Si n est une variable aléatoire bornée 9,-mesurable, alors 
E, {On} = Es (P,-p.s. sur £2,). 


4) Si la variable x est bornée et 9,-mesurable, et 7, bornée ct 
9è-mesurable, alors 


E, (40,1) = E (GxEsç). 


15.2. Semi-groupes d'opérateurs, 
liés à des processus markoviens homogènes 


15.2.1. Semi-groupe d'opérateurs lié à une probabilité de passage. Soit 
(£(), &, R,, P,) un processus markovien homogène à valeurs dans un es- 
pace des phases (Y, B) de probabilité de passage P(r, x, [”). Désignons par 
B(X) l'espace de Banach de toutes les fonctions bornées réelles Ÿ-mesura- 
bles sur X de norme ||/ || = sup |/(x)!. Considérons sur B(X) la famille 


des opérateurs 7}, æ 0, déñaboas 
T,f(x) = | SO) PU, x, dy), SE B(X). 
zx 


Les propriétés suivantes de la famille d'opérateurs 7,(4 > 0) résultent 
de celles de la probabilité de passage : 

1) T, est un opérateur linéaire borné de B(X) dans B(X) pour tout 
t>æ0,telquel|T,l < 1 ; 

T,,, = TT, pour tous less, = 0 ; 

3) si f(x) > 0 pour tous les x € X, alors T,/f(x) = 0 pour tous les 
xeEXett=0; 

4) si f(xo) = 0, alors To /(xo) = 0 ; 

5) si lim (x) = / (x), où /,€ B(X), pour tous les x E X, et, de 


plus, sup Il I < cæ, alors Jim 7,/,(x) = T,/ (x). 
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La famille des opérateurs {7,, ? æ 0} vérifiant les conditions; 1), 2) 
s'appelle semi-groupe contractant d'opérateurs. La propriété 3) signifie 
que l'opérateur 7, laisse invariant le cône des fonctions non négatives 
dans B(X). 

Donc, tout processus markovien homogène à valeurs dans l'espace 
des phases (X, 8) engendre un semi-groupe contractant d'opérateurs 
{T,, 1 æ 0} vérifiant les conditions 3), 4), 5). Ceci étant, des processus 
markoviens équivalents engendrent un même semi-groupe. 

On démontre que tout semi-groupe contractant d'opérateurs agissant 
dans Z(X) et vérifiant les conditions 3), 4), 5) engendre une probabilité de 
passage homogène, et de plus P(?, x, 1) = T,yrx). 

Donc, pour étudier les processus markoviens, on peut se servir de la 
théorie des semi-groupes. 


15.2.2. Opérateur infinitésimal. Soient (%, 8) un espace mesurable, 
T,, t > 0} un semi-groupe contractant d'opérateurs agissant dans B(X). 
finissons l'opérateur infinitésimal 4 du semi-groupe 7, par la formule 


AJ = g Si 
Tf- 
Le | = 0. 


Le domaine de définition D, de À est composé de toutes les fonctions 
JE B{X') telles que la limite 


existe, uniformément en xEX. De toute évidence, D, € B(X) — 
= {f: SE B(X), imIIT SU = 0}. 


Voici quelques Dropriétés de l'opérateur infinitésimal. 

1) L’adhérence de l'ensemble D, (au sens de la convergence pour la 
norme) est confondue avec B,(X). 

2) Si fE D ,, alors AfE€ B,(X }et 


r 
Tf-f = [ TAf ds. 


3) Si SE D ,, alors la fonction 7,/ est fortement dérivable par rapport 
àt,t > 0,et 
TS _ 


ir = AT = TA. 


4) L'opérateur À est fermé. 
Pour les À positifs, définissons les opérateurs R sur B,(X) par 


Rae() = ['e-ATe( dt, 8€ BiX). 
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(On remarquera que pour de tels g la fonction T;g est une fonction bornée 
fortement continue, donc l'intégrale de cette formule existe toujours pour 
À — 0 et définit une fonction de B(X)). La famille des opérateurs R; s'appelle 


résolvante du semi-groupe 7,. Voici les propriétés de la résolvante : 
1) l'équation résolvante 


[ 
RiRy = gx lRu Rail 
est vérifiée pour À, u > 0; 
I 
2) Il Rall 7? 


3) la fonction f = Rig est l'unique solution de l'équation 2/— A/f = g, 
2 > 0,g € B{X). 

Donc, R1 = (41—A)°!, où / est l'opérateur unité, et c'est une bijection 
de B.(X }sur D. 

Posons Rifx, 1°) = Ri7r(x), 4 > 0,x € X, 1’'E B. La fonction R;(x,1)) 
s'appelle noyau résolvant. De toute évidence, 


RaeQ) = [ Ritx, dy)80), 8€ BX). 
x 


15.2.3. Processus stochastiquement continus dans des espaces topologiques. 
Soit P(t, x, 1”) une probabilité de passage homogène dans un espace (X, 3). 
En vertu du numéro 15.2.1, cette probabilité cngendre un semi-groupe 
d'opérateurs T, de B(X) dans B(X). On appellera l'opérateur infinitésimal 
A de ce semi-grourc opérateur infinitésimal de la rrobatilité de rassage 
P(t, x, 1). D'après le nunéro 15.2.2 


[JG P(, x, dy)-f (x) 
AL) = in = 
‘40 [4 

et SE D, si cette limite existe uniformément en x € X. 

Jl se pose la question de savoir sous quelle condition la probabilité de 
passage est déterminée de façon unique par son opérateur infinitésimal. 

Avant de formuler le théorème qui répond à cette question, introdui- 
sons la notion de probabilité de passage stochastiquement continue. 

Soient X un espace topologique, B la tribu de ses boréliens. On dit 
qu’une probabilité de passage homogène P(1, x, 1”) est stochastiquement 
continue si pour tout x € Yet tout voisinage Udexona 

liro P(r, x, U) = 1. 
14,0 

Désignons par C(X) l'espace des fonctions bornées continues réelles 
définies sur X. Si P(s, x, 1”) est une probabilité de passage stochastiquement 
continue dans l'espace (X, 8) et T, un semi-groupe correspondant d'opéra- 
teurs de B(X) dans B(X), alors pour toute fonction f € C(X) 


lim 7,/(x) = fQ, 
140 
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quel que soit x € X. Si, de plus, un semi-groupe 7, engendré par une proba- 
bilité de passage fellérienne P(#, x, l") possède cette propriété, alors P(#, x, 1) 
est stochastiquement continue. 

Théorème 1. Toute probabilité de passage stochastiquement continue 
dans un espace des phases topologique est définie de façon unique par son 
opérateur infinitésimal. 

On observera qu'une probabilité de passage stochastiquement continue 
est normale. Donc, si À est l'opérateur infinitésimal d’une probabilité de 
passage stochastiquement continue, alors il définit de façon unique (à l'équi- 
valence près) un processus markovien. Par suite, le problème de la des- 
cription de tous les processus stochastiquement continus dans (X#, 8) se 
ramène à la description d'opérateurs de B(X) dans B(X) qui sont opérateurs 
infinitésimaux de probabilités de passage stochastiquement continues. 

Il peut s'avérer qu'un semi-groupe T, engendré par une probabilité 
de passage P(r, x, 1") laisse invariant un sous-espace B de l'espace B(X). 
En considérant le semi-groupe T, dans l'espace B on peut définir l'opérateur 
infinitésimal dans Z. On l'appelle opérateur B-infinitésimal de la probabilité 


de passage P(#, x, l"). Si le sous-espace B est assez riche, on peut espérer que 
la probabilité de passage P(r, x ll) sera définie de façon unique par son 
opérateur Z-infinitésimal. 

Soient X un espace topologique, 8 la tribu de ses boréliens. On dit 
qu'une probabilité de passage homogène P(+r, x, 7") dans l'espace des phases 
(X, 8) est fellérienne si pour tous les ? > Oet fEC(X)ona 


T, f(x) = J P(t, x dy) JU) € C(X). 


En d’autres termes, une probabilité de passage est fellérienne si le semi- 
groupe qui lui correspond laisse invariant l'espace C(X). Un processus 
markovien de probabilité de passage fellérienne s'appelle fellérien. Le semi- 
groupe engendré par une probabilité de passage fellérienne peut être 
considéré dans l'espace C(X). Dans cet espace son opérateur infinitésimal 
est appelé opérateur C-infinitésimal correspondant à cette probabilité de 
passage. 

Théorème 2. Si l'espace topologique X vérifie le premier axiome de 
dénombrabilité, l'opérateur C-infinitésimal d'une probabilité de passage 
fellérienne stochastiquement continue définit cette probabilité de façon 
unique. 


15.2.4. Processus sur des compacts et semi-compacts. Voyons maintenant 
les opérateurs susceptibles d'être infinitésimaux pour une probabilité de 
passage. 

Supposons tout d'abord que X est un compact, 8, la tribu de ses 
boréliens et P(t, x, l”) une probabilité de passage fellérienne stochastique- 
ment continue dans (#, 8). On prouve que dans ce cas C(X) € B(X) 
(voir la définition de l'espace Bç(X) dans le numéro 15.2.2). Ceci signifie 
que |IT,f—-f 11 — 0 avec r pour tout JE C(X). 
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Toute probabilité de passage fellérienne stochastiquement continue 
dans le compact (X, 8) est uniformément stochastiquement continue au 
sens suivant. Soient p une métrique dans l'espace X, engendrée par la 
topologie de X, U,(x) une boule dans # de rayon & et de centre x € X. 
On dit qu'une probabilité de passage P(r, x, 1”) dans (X, 8) est uniformé- 
ment stochastiquement continue si 

lim sup (1-P(r, x, U,(x))) = 0 
1,0 “EX 
pour tout & > 0. 

Donc, le théorème 5 du numéro 14.2 nous dit que parmi les processus 
markoviens équivalents sur un compact, de probabilité de passage fellérien- 
ne stochastiquement continue, il existe un processus ne possédant pas de 
discontinuités de seconde espèce et continu à droite. Le théorème suivant 
décrit les opérateurs infinitésimaux de tels processus. 

Théorème 3. Soient X un compact, À un opérateur linéaire dans l'espace 
C(X). Pour que l'opérateur À soit opérateur C-infinitésimal d'une proba- 
bilité de passage fellérienne stochastiquement continue dans (X, B), il est 
nécessaire et suffisant que soient réalisées les conditions suivantes : 

1) le domaine de définition D, de l'opérateur À est partout dense dans 
C(X) (pour une métrique uniforme) ; 

2) l'équation 

AJ -Af=8 


admet une solution f € D, pour tout g EC(X)et À>0; 

3) si SE D,, f(x) = 0 et f(xo) = f(x) pour tous les x € X, alors 
Af(xo) = 0. 

On dit qu’une probabilité de passage est conservative, si pour tous 
lst=0etxEXona P(1, x, X) = 1. Pour qu'une probabilité de passage 
soit conservative, il est nécessaire et suffisant que son opérateur infinitési- 
mal À possède la propriété suivante : 1 € D, et A1 = 0. 

Si À est opérateur infinitésimal d’une probabilité de passage conserva- 
tive, alors la propriété suivante a lieu : 

3")sife D, et f(x) = f(x) pour tous les x € X, alors A/(xo) & 0. 

Donc, l'opérateur linéaire À dans l’espace C(X), où Xest un compact, 
est opérateur C-infinitésimal d’une probabilité de passage fellérienne con- 
servative stochastiquement continue si et seulement si sont remplies les 
conditions 1), 2), 3’) et la condition : 1€ D,et A1 = 0. 

Supposons maintenant que X est un semi-compact (c'est-à-dire un 
espace séparé localement compact muni d'une base dénombrable), #, la 
tribu de ses boréliens. Désignons par CL(#) l'espace de toutes les fonctions 
continues réelles sur X tendant vers 0 lorsque x quitte tous les compacts 
(ce qui signifie que l'ensemble {x: x € X, | (x)l > e} est un compact 
dans # pour tout & > 0). Soit P(r, x, 1°) une probabilité de passage dans 
l’espace (X, B). On dira qu'elle vérifie la condition C4, si TS E Co(X) 
pour tous les # > 0 et SE COX). L'opérateur infinitésimal du semi-groupe 
T, dans l’espace C,(X) sera appelé opérateur C,-infinitésimal de la probabili- 
té de passage P(r, x, l"). 
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Théorème 4, Toute probabilité de passage stochastiquemtent continue 
dans un semi-compact X et vérifiant la condition C, est définie de façon 
unique par son opérateur C,-infinitésimal. 

La probabilité de passage vérifiant la condition du théorème 4 possède 
les propriétés suivantes : 

a) elle est uniformément stochastiquement continue sur tout compact ; 

b) elle est telle que C,(X) S B.(X). 

Donc un processus markovien dont la probabilité de passage vérifie 
les conditions du théorème 4 peut, dans ce cas aussi, être choisi continu à 
droite et ne présentant pas de discontinuités de seconde espèce. 

Le théorème suivant décrit les opérateurs infinitésimaux de tels proces- 
sus, 

Théorème 5. Soient XÀ un semi-compact, À un opérateur linéaire dans 
l'espace C{X). Pour qu'un opérateur À soit opérateur Co-infinitésimal d’une 
probabilité de passage stochastiquement continue dans X et vérifiant la condi- 
tion C;, il est nécessaire et suffisant qu'il satisfasse les conditions 1), 2), 3) du 
théorème 3 (il faut remplacer C(X) par C(X) dans les conditions 1), 2)). 


15.3. Opérateurs caractéristiques 
de processus markoviens forts 


15.3.1. Processus markoviens forts. Soit (£(r), &, N,, P,) un processus 
markovien homogène à valeurs dans un espace des phases (X, 8) défini sur 
un espace d'événements élémentaires #2. On dit qu’une fonction r = r{w), 
FA à valeurs numériques est un temps d'arrêt si sont réalisées les con- 
itions : 

a) 0 & To) & ((w), VE Q; 

b) {r(o) & ! < (()} EN, Vt > 0. 

Soit 92, = {w: T(w) < ((w)}. Siw € Q,, alors r(w) = {(w). 

Il est évident qu'en posant r(w) = {, pour w € 9, et 7(&) = G(w) pour 
os, on obtient un temps d'arrêt (4 est un nombre non aléatoire). 

Posons par ailleurs 


tro) = inf{s: 0=s < ((w), é(s,w)é 1}, l'ESB, 


si l’ensemble entre accolades n'est pas vide ; le cas échéant on pose rr(w) = 
= ((w). La quantité rest appelée temps de première sortie de l’ensemble 1". 
Si X est un espace topologique, le processus continu à droite et l'ensemble 7" 
ouvert ou fermé, alors rrest un temps d'arrêt. 

Supposons maintenant que QOZ &, R, P,) est un processus markovien 
progressivement mesurable (ceci signifie que l'application &(s, w) de l'es- 
pace ([0,1]X9,, ©? XN,) dans l'espace (X, B) est mesurable pour tous les #). 
Si r est un temps d'arrêt, alors l'application é(r(w), s? définit une application 
mesurable de l’espace (92,, %,) dans l’espace (X, 8). (On rappelle que 9, 
est l'ensemble de tous les À EN tels que ANT & 1 <(}EN)). 
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Définition. On dit qu'un processus markovien progressivement 
mesurable (£(r), &, R,, P,) est markovien fort si pour tous 10, xEX, 
l'E B et tout temps d'arrêt rona 


P{EG +7) € TN.) = P(4, Er), D) (P,-p.s. sur {2,). 


Le théorème suivant donne une condition suffisante pour qu'un 
processus soit markovien fort. 

Théorème 1. Tout processus markovien fellérien continu à droite à 
valeurs dans un espace des phases topologique est markovien fort. 

Soit (£(r), &, N,, P,) un processus markovien fort. Définissons les 
opérateurs de translation 0, pour 4 € et un temps d'arrêt + par la formule 


0,4 = U (8,4)N {x = 1}. à 


Si y est une variable aléatoire 9-mesurable, on posera 
0,%o) = 0 o) 


pour w € {r(w) = 1 < G(w)}. La fonction 6,7 est définie uniquement sur 
l'ensemble 9.. 

Les propriétés suivantes d'un processus markovien fort découlent 
immédiatement de la définition. 

Si (£(), &, R, P,) est un processus markovien fort et x un temps 
d'arrêt alors : 

1) P,{0, A/R) = Per (A) (P,-p.s. Sur 92,) pour tous les A EN ; 

2) P,(AN0,B} = &r(B) P,(dw), pour tous les AEMR,, et BEN ; 


4 

3) E {nt} = Er (P,-p.s. sur 9,) pour toute variable aléatoire 
bornée J-mesurable 7. 

4) E{m,x}) = E{nE:«y*x} pour toute variable aléatoire bornée 
N,-mesurable 7 et toute variable bornée J-mesurable x. 

D'après la défnition 6 du 14.2 on dit qu'un processus markovien 
homogène normal (£(r), &, %,, P,) à valeurs dans un espace des phases 
(X, B), où X'est un semi-compact et 8 la tribu de ses boréliens, est standard 
si sont remplies les conditions : 

a) N,=N,,;, 1=0; 

b) le processus (£(r), &, R,, P,) est continu à droite et admet des limites 
à gauche ; 

c) le processus (£(r),&,N,, P,) est markovien fort ; 

d) le processus (£(r), &, R,, P,) est quasicontinu à gauche. 

Théorème 2. Si P(r, x, l') est une probabilité de passage fellérienne 
stochastiquement continue sur un compact ou une probabilité de passage 
stochastiquement continue sur un semi-compact et vérifiant la condition C:, 
alors PRE un processus markovien standard de probabilité de passage 
P(t, x, 1”). 

En conclusion de ce numéro, donnons un exemple de processus marko- 
vien non markovien fort. 


335 


Exemple. Soient X = ]-c, [, 8 la tribu des boréliens de X. 
Pour t > 0,x € X, l'E D, posons 


1 (> x)" 
—— lexp{-———"$ dy pour x #0: 


4Ix) pour x= 0. 


Ji est immédiat qu'on peut construire un processus markovien non 
tronqué continu homogène (£(r), #,, P,) de probabilité de passage P(+, x, l'). 
Pour ce processus la variable aléatoire (finie !) + = + x\{o) Qui est le temps 
de première sortie de l'ensemble X\{0} est un temps d'arrêt. Supposons que 
l'ensemble À est composé des w pour lesquels il existe un # tel que £(s,w) — 0 
pour tous les s æ 1. Alors P,(4) = 0 pour x # 0 et P,(4) = 1. D'autre 
part, ilest évident que 0,4 = À. L'égalité 


P (054) = E,P 4) 


ne peut donc être réalisée, puisque pour x # 0 son premier membre est nul 
et son second égal à 1. Par suite, le processus (£(r), N,, P,) ne peut être 
markovien fort. 


15.3.2. Opérateur caractéristique. Soit (£(1), &, N,, P,) un processus fellérien 
(donc markovien fort) continu à droite dans un semi-compact X. Si À est 
l'opérateur infinitésimal de ce processus et f € D ,, alors 


E,f(E())-/ (x) = E, Î AJ(E(S)) ds, 


pour tous les # > 0, x € X) voir n° 15.2.2, propriété 2) de l’opérateur in- 
finitésimal). 

Dans certains cas, cette formule subsiste si l'on remplace # par un 
temps d'arrêt +. Plus exactement, supposons que 7 est un temps d'arrêt 
pour le processus (£(r), 6,9, P,) et Est < co. Sif € D ,, alors 


E,/(é(r))-fG) = E, [ AJ(E(Ss)) ds. G.1) 
0 


On dira qu’un point x, € X est absorbant si P,,{é() = x,} = 1 pour 
tous les #? æ 0. Si x, est absorbant, T,/(xo) = f(x) pour tous les s et tous 
les SE B(X). Si x n'est pas absorbant, il existe toujours un voisinage U de 
x tel que E,ry < ©, où 74 est le temps de première sortie de l'ensemble 
ouvert U. 

On dira qu'une suite de voisinages U,, n = 1, 2, ..., d'un point x 
converge vers x (et on écrira UV, 4x) si pour tout voisinage U de x il 
existe un nr, tel que VU, C Upourn > "0. 
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res que x E À est un point non absorbant du processus 
(EG), 8, À, P,)et U, 4 x. De la formule (3.1) il résulte 


E —fC 
AJ(x) = _lim ini E (3.2) 


—& 09 


où T, — Tu si seulement / € D, et la fonction A/f est contigyie en x. 
Si x est absorbant, alors ry = pour tout voisinage U de x:.On peut 
donc considérer que le second membre de (3.2) s'annule en un point 
absorbant. Il en va de même pour le premier membre. 

Si donc À est l’opérateur C-infinitésimal d’un processus fellérien continu 
à droite et f € D ,, alors on peut calculer les valeurs de la fonction 4/ pour 
tous les x € X à l’aide de la formule (3.2). 

Désignons par Di, l'ensemble de toutes les fonctions SE C(X) telles 


que pour x € X donné existe la limite 
AS(x) = lim E,/(é(r.)) —f(x) 


n —+ 00 E,r, L 


où U, est une suite arbitraire de voisinages du point x, convergeant vers x et 
7, = To, Si SE N D3,, la limite correspondante existe pour tous les 


sex 
x € X et définit une fonction A/(x). L'opérateur A s'appelle opérateur 
caractéristique du processus. Son domaine de définition Dy; = N Di sst 


ze x 
composé de toutes les fonctions SE C(X) telles que la limite du second 
membre de (3.2) existe pour tous les x € X. 11 s'ensuit que l'opérateur 
caractéristique d’un processus fellérien continu à droite dans un semi- 
compact X est l'extension de son opérateur C-infinitésimal. Ceci signifie 
que D, © Dy et pour fE D, on a l'égalité : A/(x) = A/(x). 

Si U est un sous-ensemble ouvert de X, r = ty, le temps de première 
sortie de U, on posera 


7y(x, 1) = P(É(T)E I"), xex, l'es. 


La probabilité x,(x, 1") s'appelle probabilité de sortie de l'ensemble U. 
En termes de probabilité de sortie, l'opérateur caractéristique peut être mis 
sous la forme 


FO 70,0% dy) —J (x) 
AC) = mn OO ED, U,ix 


= —+ co Ets, ÿ 


Donc, l'opérateur caractéristique est défini par les probabilités de sortie et 
par le temps moyen avant la sortie de voisinages aussi petits que l’on veut 
du point initial. Si le processus ne s'arrête pas et est continu, alors ë(r,) 
appartient à la frontière de l’ensemble U. Donc l'opérateur caractéristique 
est local pour les processus continus. 
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On remarquera que les opérateurs caractéristiques de processus équi- 
valents sont confondus. Cependant, l'identité des opérateurs caractéristiques 
n'entrainc pas nécessairement l’équivalence des processus. 

Dans certains cas il est possible de décrire avec plus de précision la 
relation liant les opérateurs infinitésimal et caractéristique. 

me 3. 1) Soient (£(r),N,, P,) un processus fellérien stochastique- 
ment continu non tronqué sur un compact X, À son opérateur C-infinitésimal. 


Alors 
D, = DyNCXN(S : USE C(X)}. 


2) Soient (Ë(r), À, P,) un processus stochastiquement continu non tron- 
qué dans un semi-compact X, vérifiant la condition C,, À son opérateur Co-irr- 
finitésimal. Alors 


D, = DyN CANNES : USE C(X)}. 


15.4. Processus à ensemble dénombrable d'états 


15.4.1. Classification des points. Soit (£(r), 6, N,, P,) un processus markovien 
à valeurs dans l’espace des phases (4, 8) vérifiant la condition (S) suivante : 
si Ë(s, w) = x pour toutes les valeurs rationnelles s de l'intervalle }x, Bf{, 
alors &(s, w) = x pour tous les s € ]x, BA. (Cette condition est remplie si le 
processus est continu à droite dans un espace topologique.) 

Soit 7, le temps de première sortie du point x. Alors 7, est un temps 
d'arrêt et 

Pr >1}= ee, 


où ax) est une fonction non négative de x, éventuellement égale à + dans 
certains points. 

On distinguera donc trois cas pour chaque point x € X : 

1) dx) = 0 ; dans ce cas 7, = + et le point x est dit absorbant 
(cf. n° 15.3.2) ; 

2) ax) = +0 ; dans ce cas r, = 0et le point x est dit passant ; 

3) 0 < ax) <= +00 ; dans ce cas 0 < Fr, < + et le point x est dit 
inhibiteur. 


Si l’on convient que 2 = +o et ne = 0, alors dans tous ces cas 
0 + co 


on a de toute évidence ax) = (E,7,) !. 

On dit qu'un processus markovien (£(r), &, A, P,) est discontinu si 
pour tous w et # € [0, E(w)[ il existe un Ô > 0 (dépendant de s et w) tel que 
E(t) = E(t+h) pour tous les AE[O, Ô. L'instant #, s'appelle instant de 
saut de la trajectoire £(s, w), si existe une suite #, tt, telle que (1, ©) 
# Eto, ©), n = 1,2,... . L'opérateur infinitésimal d’un processus discon- 
bus est la restriction d’un opérateur associant à une fonction f € B(X) la 
onction 


— ax) f'()+ ax) ES (E(r.)) = — ax) JG) + ax) [ SO) ax, dy), 
x 
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où a(x) = (E,r,)"!,71(x, 7°) = P,{5(r,) € l'} (les processus discontinus n 
présentent visiblement pas de points passants, de sorte que a(x) # pou 
xEX). 

n dit qu'un processus discontinu est en escalier si pour tout «w 
l'ensemble des instants de saut ne possède pas de points limites à l’intérieur 
de l'intervalle [0, é(w). Si P(r, x, 1°) est une probabilité de passage dans 
l'espace des phases (X, 8) et si 


lim P(4, x, x) = 1 
140 


uniformément en x € X, ilexiste alors un processus en cscalier de probabilité 
de passage P(1, x, ”). 


15.4.2. Dérivabilité des probabilités de passage et équations de Kolmogorov. 

Etudions plus en détail les processus à nombre dénombrable d'états. Soient 

X un ensemble dénombrable (ou fini), 8 la tribu de ses parties. Dans ce cas 

il suffit de considérer la probabilité de passage dans des ensembles à un 

point P(, x, y) = Pt, x, {y}, puisque P(t, x, T°) = L P(t,x,y). La 
. T° 


fonction P(s, x, y),1 > 0, x, y € X, vérific les conditions : 
a) P(r, x, y) > 0; 
b) , P x,p)=<l; 
C) PG +, x, }) = À P(s,x, 2) PG,2,»),5,1æ0,x,y€ X. 


On dit qu'une probabilité de passage P(1, x, y) est stochastiquement 
continue si 
d) lim P(r, x, y) = O(x, y) pour tous les x, » où x, y) = O0 pour 
1,0 


x À pet x, y) = 1 pour x = y. 
Les nombres P(#, x, y), x, y E X, vérifiant les conditions a) à d) pour 
tous les ? æ 0 forment une matrice P(r) dite matrice semi-stochastique. Si la 


condition 
P{,x,y) = 1 
v X 


est réalisée à la place de la condition b) pour tous les # = 0 et x € X, alors 
la matrice P(r) est dite stochastique. De toute évidence 


P(e) P(s) = P(s) P(r) = P(s+1). 


Théorème 1. Soient ee, des fonctions P{t, x, »»,1=0,x,yEX, 
vérifiant les conditions a) à d). Alors 
1) pour tous les x > y existent les limites finies 
P(, x, y) 


ax, y) = lim -—-2— ; 
1,0 { 
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2) pour tout x € X'existe la limite 


ax) — lim FRE ; 
110 [4 
éventuellement égale à + cs ; 
3) pour tous les x € X 


L a(x, y) = (x). 
vérx 


Az 


Si un processus de probabilité de passage P(+?, x, y) vérifie la condition 
(S) du n° 15.4.1 et r,,, est le temps de première sortie de l'état x, alors 


P, {rs > 1} = en 


où 0 <& G(x) << + co. On démontre que dans ce cas a(x) = ä(x), où a(x) est 
introduit dans la proposition 2) du théorème 1. Donc d’après la fonction 
a(x) on peut classer tous les points de l'espace X en passants (a(x) = +), 
absorbants (a(x) = 0) et inhibiteurs (0 < a(x) < + ce). 

On dit qu'un point non passant x est régulier si 


a(x) = > a(x, y). 
vAz 
Les points absorbants sont visiblement réguliers. Un processus dont 


tous les points sont réguliers s'appelle processus localement régulier. 
Si x) <+c pour un xE€ X, alors pour tous les yE X,1=0,ona 


PE ED) > > ax, 2) PU, 2, }) ; (4.1) 
PE 9) > L P(t, y, 2) à(z, x), (4.2) 


où dx, x) = — dx). 

Théorème 2. Si pour une fonction P(t, x, y),t = 0, x, y € X, satisfaisant 
les conditions a) à d) tous les points sont réguliers, alors on a le système d'équa- 
tions 

PEL LS dx DPGEY, 10, MxEX. (43) 
sex 


Le système d'équations (4.3) s'appelle premier système d’équations 
de Kolmogorov. Sa condition initiale est 


Jim P(4, x, y) = (x, y), x, EX. 
‘10 


Désignons par À la matrice d'éléments a(x, y), x, v € X. En écriture 
matricicile, les équations (4.3) deviennent 


oP(r) _ 
pYi : AP (1), 


OP(t) | . OP(t, x, ») 
ET est la matrice d'éléments ET 


Le système d'équations (4.3) s'écrit encore : 


,  X YEX. 


où 


t 
Pt, x, y) = 6x, per" + fer ax, 2) PUS, 2, y) ds. 
0 1243 


Pour y # x posons 7x, }) = ee 810 < x) < + æetz(x, y) = 0 pour 
ax) = 0. Le système précédent d'équations intégrales prend alors la forme 


{ 
PA x») = ae "où D ax, 2) PUS, 2, p}ds, x #y, x YEN; 


0 sÉz 


{ 
Pt, x, x) = et [a(x)e D ax, z)P(t-5s,z,x)ds, XEX. 
0 2É3 


Ces égalités admettent une interprétation probabiliste simple. La der- 
nière, par exemple, dit que : le système quitte l'état x et peut se retrouver 
dans cet état à l'instant s soit qu'il y reste tout ce temps (la probabilité de cet 
événement est e “**) soit qu'il le quitte à un instant s (la probabilité de cet 
événement cest a(x)z7**) ds) pour un état z # x (la probabilité de cet évé- 
nement est zx, z)) ct passe de z en x pendant lc reste du temps 1-5 (la 
probabilité de cet événement cest P(r—5s, z, x)). Ceci étant, nous devons 
(sommer) intégrer le produit de ces probabilités par rapport à tous les temps 
de première sortie (c’est-à-dire par rapport à s de 0 à r) et par rapport à tous 
les états z x. Les quantités xx, y) s’interprètent donc comme la probabili- 
té qu’au temps de première sortie de x le système se trouve en y. 

Si dans (4.2) on remplace le signe d’inégalité par le signe d'égalité, 
on obtient le deuxième système d'équations de Kolmogorov : 


226, 2, D) = L P{,x,z)az,y), x,vEX. (4.4) 


Cependant, même dans le cas où tous les points x € X sont réguliers, on ne 
peut en général pas affirmer que les probabilités P(r, x, y) (c'est-à-dire les 
fonctions vérifiant les conditions a) à d)) sont solutions du système d'équa- 
tions (4.4). Une condition suffisante pour que les probabilités P(r, x, y) le 
soient est traduite dans le théorème suivant. 

Théorème 3. Supposons que les nombres P{r, x, y}, 120, x, yEX, 
forment une matrice stochastique telle que sup ax) < cs. Alors tous les 
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points x € X sont réguliers et les probabilités P(t, x, y) sont solutions du deu- 
xième système d'équations de Kolmagoror. 
On peut prouver que le fait que la fonction «&{x) soit bornée est équiva- 
lent à la condition 
lim sup (1—P(, x, x)) = 0. 
1,0 rex 


Dans ce cas le processus de probabilité de passage P(r, x, y) est équivalent 
à un processus en escalier ainsi qu’il résulte du n° 15.4.1. 

Si X est fini et P(r) est une matrice stochastique, alors la fonction «(x) 
est bornée, tous les points x € X sont réguliers et le deuxième système d'équa- 
tions de Kolmogorov est réalisé. 


15.4,3. Solution minimale. Jusqu'à maintenant on a supposé que la proba- 
bilité de passage P(r, x, y), 1 æ 0, x, y E X, était donnée et l'on a construit 
d'après elle la matrice À = [Ia(x, »)1l, x, » EX. Posons maintenant le 


problème inverse. Soit donnée une matrice À = |la{(x, ri, x, y E Y, 
vérifiant la condition 
À) pour x # y 
xD 0 ct _—-- Ÿ «x,» <0 
rex 


pour tous les x € X. 

Existe-t-il une probabilité de passage P(,x,7) pour laquelle 
Fe = &(x, y) pour tous les x, y € X ? 

Pour répondre à cette question il est naturel de considérer les deux 
systèmes d'équations différentielles 


. (x, AT À x, 2) Q(, Z; y), \,Y€ x , (4.5) 

0Q 

wrxn= L'QUx 2er», xYEXx (4.6) 
sex 


avec la condition initiale lim Q(r, x, y) = x, y). 
140 


Posons 
Pr, x, y) = dx, Pe*eY ; 


{ 
Pat (4, x, y) = D feux, z) Ps, z,y)ds, n=0,1,2,.... 
sÉz 0 


On montre que les fonctions P%}(1, x, y) peuvent être définies également 
par le système d'équations : 


0 
Pat, xp = D fe-nu-2oz, y) POS, x, 2)ds, n=0,1,2,..., 
SFY 0 


342 


Soit 


Pa, x, y) = D PE, x, p). 


n°0 


Théorème 4. Pour toute matrice À vérifiant la condition A) la fonction 
Pt, x, »),12>0,x,y€ X, construite plus haut est une solution des systèmes 
d'équations (4.5) et (4.6) vérifiant les conditions a) à d). 

On prouve que si P(t, x, y), 1 = 0, x, yE Y, est une fonction satis- 
faisant les conditions a) à d) et la relation 


OP 
CIE ax), x EX, 


de matrice donnée 4, alors P(s, x, y) = P(1, x, v), où Pr, x, y) est la fonction 
construite plus haut d'après la même matrice 4. C'est pourquoi (sr, x, ») 
est appelé solution minimale correspondant à la matrice À. 

Si pour une matrice donnée À vérifiant la condition A) la solution mini- 


male Pr, x, ») est telle que S° Pr, x, y) = 1 (c'est-à-dire la matrice P(r) 
cst stochastique), alors toute fonction P(t, x, y) satisfaisant les conditions 
a) à d) et la condition d (0, x, y) = à(x, }), x, v E X, est confondue avec 
P(r, x, y). En particulier, dans ce cas P(+?, x, y) est l'unique solution des sys- 


tèmes d'équations (4.5) et (4.6), et de plus, la matrice 4 doit nécessairement 
vérifier la condition D «x, p) = 0 au lieu de l'inégalité correspondante 
X 


€ 
dans la condition A). | 


15.44, Processus réguliers, Soient (£(1), %,, P.) un processus localement 
régulier non tronqué vérifiant la condition (S), P(r, x, y) sa probabilité de 
passage. Posons r, = inf {s : (r) # (0)} ; si (1) — £(0) pour tous les #, on 
conviendra que T, = + co. L'instant 7, s'appelle temps de premier saut. 
Définissons la suite de temps 7, par 


Th+t a Tnt Tir n = 1, 2, re 


en outre, si 7,(&) = + on conviendra que 7,(w) = + pour tous les 
j = k. De toute évidence, r, est le temps du #-ième saut. Posons r, = 0 et 
Eh = Er,), n = 0, 1,2, .... Si, de plus, 7,(&) = + ©, alors on admet que 
Go) = Cr 1(w). La suite {€,, n = 1,2, ...} forme une chaîne homogène de 
Markov dont la probabilité de passage en un pas est définie par les relations : 
ax, }) 
7x, y) = ss SH x et x) = 0; 
(x, ») 4) y ax) 


zx, x) = 0, si ax)=0; 
ax, y) = (x, y), si  @(x) = 0. 
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Appelons régulier un processus (£(). NN, P,) tel que pour tous les 
LA ( 


P,{ lim 7, = + œ} EE 
nm -—> 

Un processus régulier ne présente qu'un nombre fini de sauts sur tout 
intervalle temporel fini. On montre qu’une condition nécessaire ct suffisante 
de régularité d’un processus est que pour tous les x € X 


(on admet que la somme est infinie si a(&,) = 0 pour au moins un k). Il 
s'ensuit deux conditions suffisantes de régularité du processus : 
1) pour qu'un processus soit régulier, il suffit que la fonction a(x) soit 
bornée ; 

2) pour qu'un processus soit régulier, il suffit que la chaîne de Markov 
(nn = 0, 1,...) soit récurrente. 


Supposons par ailleurs que _ (0, x, y) = dx, p), x, y € X. 


Le processus (£(r), X,, P,) étant localement régulier, on a 
D» x, y) = 0. Donc, la fonction P(?, x, ») est solution de l'équation de 
rex 
Kolmogorov. Définissons d'après la matrice A4 = [|a(x, y)|| les fonctions 
PA, x, y), n = 0, 1,2, ...,et P(1, x, y) comme plus haut. Alors 


PO, x, y) = P {rs > 1, E() = y}; 
POr, AN y) a P,{r, «1 < Tn+1 (9) = y}, = 1, 2, EE 


P(t, x, y) = P,{ lin 7, > 1, (4) = »}. 


An —+ © 


Donc, si le processus est régulier, alors P(r, x, v) = Pr, x, y) et, par suite, 
P(t, x, y) est l'unique solution du premier système d'équations de Kol- 
mogoroy. La réciproque est vraie, savoir : si le premier système d'équations 
de Kolmogorov admet une solution unique, alors le processus est régulier. 
En outre, la probabilité de passage d’un processus régulier est solution du 
deuxième système d'équations de Kolmogorov. 

Soit B(X) l'espace de toutes les fonctions réelles bornées sur X. Si l’on 
munit # d’une topologie discrète, alors B(X) = C(X), où C(Æ#) est l’espace 
des fonctions bornées continues sur X à valeurs réelles. Pour un processus 
localement régulier (séparable) est défini l'opérateur caractéristique 


E,/(Ë(r:))- 
AS = AE) = ) ax,» f(»), 
ex 


E,T; 


où SE B(X). Donc, l’action de l'opérateur % sur la fonction f se ramène à 
une multiplication de la matrice À par le vecteur colonne (y), y € X. Ceci 
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étant, la fonction A/(x) peut être indéfinic. Posons Day = {/ : f E B(X), 


ASE B(X)}. Nous avons vu que d'après la matrice À on peut construire 
de façon unique le processus jusqu'à l'instant de première accumulation des 
sauts, c'est-à-dire jusqu'à l'instant 7 = lim 7,. Donc, l'opérateur caracté- 
ristique définit de façon unique le processus (à l’équivalence près) au 
moins dans deux cas : 

1) lorsque le processus est réguiicr ; 

2) lorsqu'il s'arrête à l'instant 7. 

Dans le premier cas, la probabilité de passage est l'unique solution du 
premier (et du deuxième) système d'équations de Kolmogorov. Dans le 
deuxième cas, la probabilité de passage est solution minimale des systèmes 
d'équations indiqués. (Il est entendu que si 7 = + les deux premiers cas 
sont confondus.) On observera que si dans le deuxième cas 7(&) < + co, 
alors &(t, w) sort de tous les compacts pour # t H{w). Les ensembles cons- 
titués d’un nombre fini de points sont compacts dans X. 

Pour construire un processus markovien non tronqué d’après un opé- 
rateur caractéristique donné A (c'est-à-dire d’après une matrice donnée À 
vérifiant la condition A) avec le signe d'égalité) il faut se donner les lois des 
états du processus aux instants d’accumulation des sauts. Il est évident 
qu'il existe plusieurs manières de le faire. Les problèmes liés à la construction 
de processus markoviens pour lesquels un opérateur donné 9 est caracté- 
ristique relèvent de la théorie des frontières pour les processus markovicns. 


15.4.5. Exemples. 1. Processus de croissance pure. Supposons que X est 
l'ensemble de tous les entiers non négatifs, et soit donnée une suite numé- 
rique &x), x = 0, 1,2, ..., telle que 0 = a(x) < ©. Posons a(x, x +1) — 
= Ax),x = 0,1,2,...,a(x, x) = —a(x) et enfin ax, y) = 0, siy # x +1, 
y # x. Nous venons de définir une matrice À vérifiant la condition A) et de 
plus ÿ dx, y) = ax, x) +a(x, x +1) = 0. 


Le Dernière système d'équations de Kolmogorov est 

PU xD) = — ax) Pt, x, y) tax) PG, x +1, }), 0h25: 
Ecrivons le deuxième système : 

PQ 2») = as) Pt, x, p)+4y=1) Pt, x, y-1),  p=1,2,.... 


La transformation de Laplace nous donne 
p-1 y | 
x, }) = k DETTE 
AE (I « ) IL 706 


où p,(x, ») = [ e-"'P(r, x, pdt, x, yEX, x & y, p > 0. Si les nombres 
0 
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a(k) sont distincts, alors P(r, x, ») = O si y < x, P(t, x, x) = 1—ert, 


SiY > X, 
P pi L v eu 
(4, NX, ») = ( ) nt 
) il 4 Aus DK) 
y 
où k) = [I («r)-«k)). Ceci est la solution minimale. 
r£k 
Le temps de première accumulation des sauts Ü := Jim +, est 


R + © 
une somme de variables aléatoires indépendantes exponentiellement 
réparties 7, 5 = 1, 2,... telles que P,{r; > r} = e-*““4i-1t, Pour que 
P,{£ = +) = 1 pour tous lesxE X, il faut et il suffit que la série 


[a x)]"" diverge. Un processus est appelé processus à croissance linéaire 
D « 


z 

si a(x) = 2x, x = 1,2,..., À est un nombre positif. De toute évidence, 
un processus à croissance linéaire est régulier et ses probabilités de passage 
sont confondues avec la solution minimale de l'équation de Kolmogorov. 


2. Processus de reproduction et de mort. Posons 


—(2,+p,), Si v=Nx, x = 0,1,2;:::.; 
ne A: : y=x\x+li, = 02. 
PA si p=x\x-li, te 2;::s 
0. si [|py—-x| > I. 


Les équations de Kolmogorov (le premier et le deuxième système) s'écrivent 
OP(4, x, y) 


a" A+n) PU PHP XI, + 
+2,P(I, x +1, y), x= 0: 1, 2, . (to = 0) ; 
Ju, 2 D) »}) = — (4, +/y ) P(s, x, »)+4,-1P(, x,y—1)+ 


+HyaPG NX, Y + D), »=0,1,2,... (0 = À = 0). 
Les probabilités stationnaires, c'est-à-dire des nombres p(x), x € Y, 
tels que p{x) > 0, p> ro = 1 et p() = Pr rx) P(, x, y) pour tous 


les y € Yet: = 0, sont très importantes dans les applications. On montre 
que si #, > 0 pour x = 1,2, ..., alors une condition nécessaire et suffi- 
sante d'existence de la loi stationnaire est la convergence de la série 


is lo CRC] hs 
és flute... fl 
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Si cette série converge, alors 


2o2: CRC À Ed | 
= ——— —— 0), A=1;2 ses 
TA ANT 


PO) = (14 ÿ OT 


El lille ... JU 
Si les probabilités stationnaires existent, alors p() = lim P(+, x, v), 
£ — © 


rEX,VYE x. 


15.5. Fonctionnelles de processus markoviens 


15.5.1. Fonctionnelles multiplicatives. Soit (£(1), 9,, P,) un processus 
markovien à valeurs dans un espace des phases (X, 8). On dit qu'une 
famille de fonctions réelles «, = «{(w), t = 0, w € {, est une fonctionnelle 
multiplicative homogène si sont remplies les conditions : 


M1) «, est une variable aléatoire N,-mesurable pour tous les £ æ 0 ; 
M2) pour tous les ? > 0 et À = 0, la relation 
Œyya = au, 


est P,.-presque sûrement réalisée quel que soit x € #. 

Au n° 14.3 nous avons étudié des fonctionnelles multiplicatives 
vérifiant la condition subsidiaire : 

M3) pour tous less > Oetxe X 


O=a.<l! 


P,-presque sûrement. 
Si X est un espace topologique et le processus continu à droite, alors 
comme exemple de fonctionnelle multiplicative on a la famille de variables 


@, = CXP {f u(£(s)) a) 


où x), x € X,est une fonction continue bornée à valeurs réelles. Si v(x) = 0 
pour tous les x € X’, alors «, vérifie également la condition M3). 


15.5.2. Fonctlonnelles additives. On dit qu’une famille de variables aléatoires 
P = F{@), ? = 0, w EN, est une fonctionnelle additive homogène d'un 
processus (£(r), N,, P,) si : 

A1) la variable aléatoire y, est 9,-mesurable pour tous les # = 0 ; 

A2) pour tous les #t = 0 et À > 0 


Frra = Fa + 0xPs 
P,-presque sûrement quel que soit x € X. 
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Un exemple de fonctionnelle additive cst l'intégrale 


! 
Ti = Î u(é(s)) ds, t1:=0, 
0 
où (x) est unc fonction bornée continue sur #, le processus £(#), continu 
à droitc. 
Une fonctionnelle additive y, (on omettra le terme «homogène ») 
scra dite non négative si P,{7, := 0} = 1 pour tous les # == 0 et x € X. 
Deux fonctionnelles y, et ÿ, sont équivalentes si P,{y, = p,} = 1 
pour tous les x € X, 1 = 0. Unc fonctionnelle y, ? = 0, cst continue si 
les fonctions y,(w) sont pour tous les x € X P.,-presque sûrement continues 
comme fonction de ? à w fixe. Pour les fonctionnelles additives homogènes 
continues on a pour tous les x € X 


POP = Fisa 7, pour tous les # == 0 et h > 0} = 1. 


Théorème 1. Soit p, une fonctionnelle additive homogène continue non 
négative d'un processus (Ë(r), R,, P,) continu à droite. Posons g{t, x) = 


= E,e %, Alors pour tous lesxEXett —0 


{ 
1 E 
M = lim | 1-40, 5) ds, 
140 h 
où la limite est comprise au sens de la convergence stochastique pour la 
mesure P,. 

Soient (£(r), %,, P,) un processus markovien continu à droite à valeurs 
dans un cspace des phases topologique (#, 3), où 8 est la tribu des boré- 
liens de X, y, une fonctionnelle additive continue homogène non négative 
de ce processus. Si f(x), x € X, est une fonction borélienne non négative, 
alors, en posant 


AVAER PICOLLT 


on obtient une fonctionnelle du même type que y,. On remarquera que 
l'intégrale figurant dans cette formule est unc intégrale de Lebesgue-Stieltjes. 
Si la fonction f(x) est bornée ct continue, alors 


n—1 
LV, æ) = lim 2, S (£Cs:+ 1) [752 + 1) —7(52)), 


max fx —+ 0 
& Fe 
OÙ0=s <<... <s = ft, = Sie 


15.5.3. W-fonctionnelles. On dit qu'une fonctionnelle y, additive homogène 
continuc non négative est une W-fonctionnelle si pour tous les # = 0 


sup E,y, < oc, 
sCZI 
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Si y, est une W-fonctionnelle, alors pour tous les # naturels et 1 > 0 
sup E,{(7,)" = n1! (sun Em) : 
zex ze x 


La fonction 
L, (x) :: Eg, t= 0, NE NX, 


s'appelle caractéristique de la W-fonctionnelle. On montre qu'une W-fonc- 
tionnelle est définie de façon unique par sa caractéristique, et de plus 


n-1 
ie ne 2 AGO) 

OùÙ0O=s5<s<...<s, = 1, As = 5,15, la limite étant une limite 
comprise au sens de la convergence en moyenne quadratique pour la 
mesure P, pour tout x € X. 

La caractéristique d’une W-fonctionnelle satisfait les conditions : 

W!1) pour t = 0 la fonction f(x) est une fonction B-mesurable de x, 
et pour x € X fixe, continue en # et monotone non décroissante ; de plus, 


lim /,(x) = 0, sup f(x) << ; 
140 ze x 


W2) pour tous les = 0,5 —0etxe X, 
1 + (X) 7 SX) + E, (EC )). 


Toute fonction /,(x) vérifiant les conditions W1) et W2) s'appelle W-fonc- 
tion. 

Le théorème suivant contient une condition nécessaire et suffisante 
pour qu’une W-fonctionnelle soit associée à une W-fonction. 

Théorème 2. Soient X un espace séparable métrique complet, 
(£G), R,, P,) un processus continu à droite, f(x) une fonction vérifiant les 
conditions W1) et W2). Pour qu'il existe une W-fonctionnelle y, telle que 


SX) = ET 


il est nécessaire et suffisant que pour tous lsxEXett=æ0 


| if 
lim E,— Î A(E(S)) A(E(S)) ds = 0. 
0 


840,4! 


Le théorème suivant fournit une condition suffisante simple. 
Théorème 3. Supposons que le processus (£(t), ,, P,) satisfait les con- 
ditions du théorème précédent et que la W-fonction f{(x) est telle que 


lim sup /,(x) = 0. 
140 s=€Z 
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[l'existe alors une W-fonctionnelle q, telle que f(x) = Ef,, et de plus 


$ 
__….. f ACC) 
due-1 ler me 


où la limite est comprise au sens de la convergence en moyenne quadratique 
pour la mesure P, pour tous les x € X. 

Supposons maintenant que /(x) est une W-fonction arbitraire. Alors 
il existe toujours la limite / (x) = lim /.(x), et cette limite peut éventuelle- 


— © 
ment être infinie. Si /' (x) < pour x € X, alors /(x) vérifie les conditions : 
El) T,f(x) << f(x) pour tous les xEX,1=0; f(x)>=0; 
E2) au T,f (x) = f(x) pour tous les x € X. 


Toute Toacion vérifiant les conditions Eli) et E2) s'appelle fonction 
excessive. Si une fonction excessive finie f(x) est la limite pour ft +co 
de la caractéristique /,(x) d’une W#-fonctionnelle g,, alors existe la limite 


Poo = JIM 
tt 
SX) = Ep. 


On peut construire facilement la caractéristique de la W-fonctionnelle 
g, Si l'on connaît la fonction f(x). Plus exactement 


SG) = fG)-Ti SC). 


Donc, si pour une W-fonctionnelle g,(x) existe Pos Ct f(x) = Ep, < ©, 
alors la fonctionnelle y, est définie de façon unique par la fonction f (x). 
Le théorème 3 nous dit que la fonction excessive / (x) définit une W-fonc- 


tionnelle si 
lim sup [/(x)— 7, f(x)] = 0. 


En outre, 


15.5.4. Exemples. res quelques exemples de H#-fonctionnelles 
de processus wienérien. Soient X = R”, où R* est un espace euclidien 
de dimension "»1, 8 la tribu de ses boréliens. On appelle wienérien un 
processus markovien homogène continu de probabilité de passage 


Le +3 
P(t, x, T)= Ont) ? [era 1-0, xCR®. 
r 


1. Supposons tout d'abord que (£(r),%,, P,) est un processus wienérien 
de dimension 1. Posons 
{ 


1 
SX) = [ (275) ? exp {-2) ds, 1æ>0, xenRi, 
0 
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où x, est un point fixe de R'. On vérific immédiatement que (x) est une 
W-fonction. Comme f(x) = \V/ # , le théorème 3 nous dit qu'il existe 
une W-fonctionnelle y, telle que 

HO) = Ep 120, xeER!. 
D'autre part, comme (x)! — dx —-x.) pour # 40, où (x — x) est la 


fonction de Dirac {c'est-à-dire une fonction telle que 


f (x — vo) x) dx = h(xo) 
R! 


pour tout À € c(R), alors la fonctionnelle w, peut être symboliquement 
représentée par 
{ 
M = Î (ECS) — x 0) ds. 
0 
Cette fonctionnelle s'appelle temps local au point x,. On trouve immédiate- 
ment la loi de la fonctionnelle y,. Elle vaut 
2 C+s-s/)/ V2 
P,{y, _ a} _ Va 


e “du, 0<a<, XER\, 130; 


0 pour a<t0. 


Le temps local subit un accroissement seulement aux instants où Île 
processus &(#) se trouve en x,. On montre que 


= lim ze | H(IEG)—xol) ds 


où 7.(x) est l'indicateur de l'intervalle [0, €]. 

2. Supposons maintenant que m > 1 et (£(r), ),, P,) est un processus 
wienérien dans R*. Posons $ = {x: x ER", (x, ») = 0}, où v est un 
vecteur fixe de R* tel que || # 0 et (x, v) = 0, le produit scalaire dans 
R®. Désignons par r(x) la distance de x à l'hyperplan S. Il est immédiat de 
vérifier que la fonction 


à i 
fix) = | (275) ? exp {- ce ds, 120, xeR”, 
0 
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satisfait les conditions du théorème 3 et par suite il existe une W-fonction- 

nelle , de fonction caractéristique /,(x). On l'appelle temps local sur 

l'hyperplan S. Comme limrt-W(x) = Ôs(x), où Ô,(x) se déduit à partir 
140 


de la relation 
[ 5,01) (0) dx = [1@ du (5.1 


Am 
(4 cst unc fonction à support borné continue quelconque, l'intégrale de 


droite, une intégrale de surface), alors il est naturel d'écrire la fonctionnelle 
P, Sous la forme 


= f d,(E(r)) dr. 


Sa fonction de repartition est donnée par la formule 


(e+rt2))/ 4/2 
P,{p, < a} = = [ e7* du, a>0, xER", 1>0. 


3. On définit de façon analoguc la W-fonctionnelle 
(4 
Pi — Î Ô3(Ë(T)) dr 
0 


d'un processus wienéricn de dimension "m pour une sphère S de rayon R 
centrée en l'origine des coordonnées. C'est la W#-fonctionnelle de carac- 
téristique 


! 
_" rl 
E,?, = [ér [2x0 ë exp {- xl } do, 
0 8 


la deuxième intégrale étant une intégrale de surface. La fonction d,(x) est 

définie par la relation (5.1), où l'intégrale de droite est étendue à la surface 

de la sphère S. La fonctionnelle y, s'appelle temps local sur la sphère S. 

Sim > 3, il existe p. = lim 9,. La fonction de répartition de la variable 
t — co 


aléatoire pi a pour expression 


: si [xi&R; 


LME a uce 


PP < a} — 
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oùx ER", 0 <= a <>, P{p. = a} = 0 pour a — 0. Signalons encore la 


formule 
2R 


m—2 
__2RTTT 
{m—2)|x|" *° 


si [vI<R; 
Eg, = 
si [| > À. 


15.6. Transformations de processus markovicns 


15.6.1. Changement de temps aléatoire. Considérons quelques transforma- 
tions des processus markoviens. Nous avons déjà étudié un type de trans- 
formations au n° 14.3. Celui-ci était lié aux fonctionnelles multiplicatives 
d'un processus. La fonctionnelle multiplicative nous a permis de trans- 
former un processus en un sous-processus. Avec les fonctionnelles additives 
d'un processus nous aurons affaire à une autre transformation d'un pro- 
cessus markovien, appelée changement aléatoire du temps. Pécrivons-la 
brièvement. 

Soit (£(r), R,, P,) un processus markovien fort continu à droite dans 
un espace topologique (X, 8), où $ est la tribu des boréliens de X. Soit 
donnée une fonctionnelle additive homogène continue y, de ce processus, 
telle que 

PA: LE 0} = | 


pour tous les s > 0, x E X. On peut alors distinguer un ensemble 9 & A 
tel que P,() = 1 pour tous les x € Yet que la fonction y,(w) soit monotone 
croissante continue pour & € 9. On conviendra que #2 = @. 
Considérons maintenant la famille de temps d'arrêt r,, # = 0, définic 
par la relation : 
7(o) = inf{s: {w)> 1} 


pour # € [0, E(o)l, où Eco) = po) = lim yo). Posons rt) = 11, ©) — 
tt 


= {(r(w), w) pour 1€ [0, E(w)[. On montre alors que l'ensemble des 


objets (n0), és À, P,) forme un processus markovien à valeurs dans 
l'espace des phases (X, D), défini sur l'espace des événements élémentaires 
9. On dit que le processus (7{r),ê, N,, P,) a été obtenu à partir du proces- 
sus (£(r), À,, P.) par un changement aléatoire de temps associé à la fonc- 
tionnelle w,. On démontre que si le processus initial est standard, son 
transformé le sera également. 

Supposons maintenant que le processus initial est fellérien et stochas- 
tiquement continu. Montrons comment on peut trouver la résolvante du 
transformé si le changement de temps a été réalisé à l’aide de la fonction 
nelle additive 

{ 
fi ] (50) ds, (6.1) 
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où u(x), x E X, est une fonction borélienne positive. De toute évidence, 
pour fEC(X) on a (4 > 0) 


Etc) 


ROSG) = E, Î e-*f(ns))ds = E, [ e7f(EG)) dy, = 
0 


0 
= E, Î exp {- À u(Ë(s)) a SE) EC) dt. 
0 0 
Pour /, g € B(X), posons 
Qae, x, f, 8) = E,S(Ë(E) exp {- 2 [ ets) | 
0 


où 1æ0,xE€ X, À est un nombre positif. La fonction Q,(r, x, /, g) est 
l'unique solution de l'équation 


QU, x, Le) = [ SO) PU, x, dy) 2 Î ds [ Qu —s, y, f, 8) 80) Ps, x, dy). 
z 0 x 


Donc 


RAS (x) = | Où, x, fo, v) dt. 
0 


Soulignons la relation existant entre les opérateurs caractéristiques 
du processus initial et de son transformé. Supposons qu'un processus 


(70), é, R, P,)est l'image d'un processus (ËG), N,, P,) par un change- 
ment aléatoire de temps associé à une fonctionnelle y,. Supposons que la 
fonctionnelle y, est définie par la formule (6.1), où vx), x E X, est une 


fonction positive continue. Désignons par 1 et 9 les opérateurs carac- 
téristiques des processus initial et transformé. Alors, en tout point x € X 


Da = D € AG = (NI AS). 


15.6.2. Transformation de l’espace des phases. Considérons les trans- 
formations des processus markoviens liées à la transformation de l'espace 
des phases. Soient (£(r), X,, P,) un processus markovien à valeurs dans 
l'espace des phases (#, 3), de probabilité de passage P(r, x, Z'), y une appli- 
cation mesurable de l'espace (X, 8) dans l'espace mesurable (Y, B), telle 
que yX = X et que l'image d'un ensemble mesurable par y soit mesurable. 


Supposons par ailleurs que pour tout € 8 
P(+, , yT) = P(+, y. y"), t>æ0, 


quels que soient x, } € X tels que yx = yv. Posons Es) = yl(r) et désignons 
par %, la plus petite tribu engendrée par les événements de la forme 
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{£(s) € l'} pour 5 <& !, L'E%. Pour AE = À. définissons les mesures 
P,.,(4) = P,(4). Alors l'ensemble des objets (Ë(n), h,, P,) forme un pro- 
cessus markovien de probabilité de passage Pr, *, 1°) = Pr, x, y711"), où 
x est un point quelconque de l'ensemble y” 1, 1 = 0, ['eB. On dira que 
ce processus est l’image du processus (£(r), %,, P,) par l'application ;. 

L'application ; induit une application }'* de l'espace B(Ÿ) dans l'espace 
B(NX), définie par la formule 


"I = JC), SEB(X), x ex. 


Si T, et T, sont les semi-groupes d'opérateurs correspondant aux 
processus initial et à son transformé, À et 4 respectivement leurs opérateurs 
infinitésimaux, alors 


Te Ty, A = 47°, 


ct de plus € D; siet seulement si ;°f€ D... 

Si X est un espace topologique et l’application }; continue et ouverte 
(c'est-à-dire l’image d’un ouvert est un ouvert), alors les images de processus 
fellériens par l'application ; sont des processus fellériens. 

Exemple. Supposons que (£(:), N,, P,) est un processus wienérien 
de dimension 1 et que l'application agit d’après la formule yx = |x|, 
x E R!'. Alors X = [0, cf. On vérifie immédiatement que les conditions 
imposées à l'application ; et à la probabilité de passage sont réalisées, et 
nous obtenons en définitive un processus (£{(r), %,, P,) dans [0, [ appelé 
processus wienérien avec réflexion en 0. Sa probabilité de passage a pour 
expression 


P(, x, l") = Qu) * J [exp {_9n + exp {_-922) dy, 


oùt = 0,x€[0, [, 7’, un borélien de [0, 1. 


15.6.3. Processus invariants. Supposons que l'application y est une bijection 
de X sur X. Alors la probabilité de passage P(r, x, [') du processus image 
est liée avec la probabilité de passage P(4, x, 1°) du processus de départ par 
la relation P(r, x, 1°) = P(, 37 x, y7 11"). On dit qu’un processus markovien 
de probabilité de passage P(r, x, l')est invariant par l'application ;; si sont 
réalisées les conditions : 

a) pour tous © € 9 existe un em” € © tel que 75, 6) -— S(s, ©’) pour 
tous Îles s = 0 ; 

b) pour tous les # — O0, x € X, l'EN 


PQ, x, 1) = PQ, px, y). 


Définissons un opérateur 6, appliquant la tribu 94 dans N. en posant 
0,(É0 € l}= (750) E l'} = (CO EyT'T'} et en exigeant que 0, préserve 
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toutes les opérations ensemblistes. On montre que si (£(r), X,, P,) est un 
processus markovien invariant par l'application y, alors pour tous les 


AERetxeX 
P,- 0,1) = P,(4). 


Il est immédiat qu'un processus wienérien de dimension »1 est invariant 
par tous les déplacements de l’espace euclidien R°. 

Soit U,{(x,) une boule de rayon R centrée en x, dans À". Désignons 
par T8 Île temps de première sortie du processus wienérien de Ja boule 
UA{xo). Alors de l’invariance du processus wienérien par tous les déplace- 
ments il résulte que #(r,) admet une loi uniforme pour la mesure P, sur 


la sphère limitant la boule U,(x.). Donc 


Ef(é(rs)) = [ /O)d0. 


SRixe) 
k 27 
où Saxe) = y: ME R"Ir-xol = R}, 00) = pr R*=!, est Ja 
r (5) 


surface de la sphère S,(x.) et l'intégrale, une intégrale de surfuce sur 
Ss(*o). En d'autres termes, E, f (Ë(Fx)) est la moyenne de la fonction 


fO) sur la sphère S;(x.). D'autre part, on trouve sans peine que 
E,rx = JL (R-Ix-xol), x E Ur). 


Donc si % est l'opérateur caractéristique d’un processus wienérien de 
dimension m et f € Day, alors 
. mm À 
AC) = lim Re 0 Î 10)-rtx0 do. 


L'opérateur de second membre s'appelle opérateur de Blaschke-Privalov. 


15.7. Processus de diffusion homogènes 
dans des espaces euclidiens 


15.7.1. Définition. Soient R" un espace euclidien de dimension #1, #8 la 
tribu de ses boréliens. Pour x € R" désignons par D3 l’ensemble de toutes 
les fonctions réelles définies et deux fois continûment dérivables dans un 
voisinage du point x. On dit qu'un processus markovien fort continu 
(£G), 6, R,, P,) à valeurs dans l'espace des phases (R”, 9) est de diffusion 
si pour tous les x € R* on a D£ C Dÿ,, où A est l'opérateur caractéristique 


du processus. En d’autres termes, l'opérateur caractéristique d’un processus 
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de diffusion est défini sur toute fonction deux fois continüment dérivable 
dans un voisinage d'un point x € R*. 

Soient x!, x?, ...,.x" les coordonnées de x € R” dans une base de 
R®. Pour +, 10€ R" posons 4x) = (x'—xê) (x/—x9), d'(x) = xi-xé, 
ij=1,2,...,m, où x, x, ..., x$ sont les coordonnées du point vs 
dans la base choisie. Les fonctions 41,(x) = 1, -#Cv), A/(x), à, j = 1,2,...,m, 
sont deux fois continäment dérivables dans un voisinage du point v4. 
Donc, si % est l'opérateur caractéristique du processus de diffusion 
(0), 5,9), P,), alors sont définies les fonctions 


DONS) NU AN), Rte Vi 2 Sant 
Xe) MON), i- 1,2,...,m; 
(No) 7 — 1x) — — NI (x). 


1 s'ensuit immédiatement que si / € D$°, alors 


: | . O'f( x) a Of (Nu) 

AS (No) = 2 b(X0) ERERI + PE (No) — Ov! 
où cr) = 0, la matrice 2x4) d'éléments b!(xe), à, j = 1, 2, ..., m, est 
définie non négative en ce sens que (vo) 0, 0) = 0 pour tous les DE R". 

On remarque immédiatement que l'opérateur X est de la même forme 
dans une autre base, seuls les coefficients b#/(x,) et a/(xo) varient. 

Donc, si le processus (£(1), &, N,, P,) à valeurs dans (R”, B) est de 
diffusion, il existe une fonction matricielle (x), une fonction vectorielle 
ax) et une fonction numérique non négative c(v), telles que la restriction 
de l'opérateur % aux fonctions deux fois continüment dérivables est un 
opérateur différentiel elliptique d'ordre deux du type indiqué plus haut. 
La fonction «(x) est le coefficient de rupture, le vecteur «{(v), coefficient de 
transfert, la matrice b{v), matrice de diffusion. 

Le théorème suivant donne des conditions suflisantes pour qu'un 
processus soit de diffusion. 

Théorème 1, Soir (Ë(), EN, P,) un processus continu à valeurs dans 
CR). Supposons que pour tout point X ER" sont réalisées les condi- 
tions : 

1) il existe un voisinage U, du point x telque Esry, 7 <, où 7y, est le 
temps de première sortie de U, ; 

2) les limites 


— C6) Jo), 


lim : [I—P(1, x, R*)] = c(x); 


1,9 


lim : J GC x) PG, x, dy) — «'(x), is NE 
110 P 


kR'" 


lim J Gt x) O-\) PG, x, dv) — DN), LS = 2 ss nt 


R'* 
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existent dans un certain système de coordonnées, les expressions figurant 
sous le signe lim étant uniformément bornées pour x € R“, 1 = 0, et les 
fonctions c{x), a!(x) et b(x), continues au point x. 

Alors le processus (£(r), &, À, P,) est de diffusion et c{x) est son coefi- 
cient de rupture, a(x) = (au(x), ..…., 4"(x)) son vecteur de transfert, b{x) = 
= ||b{(x) ||, sa matrice de diffusion. 


15.7.2. Construction de processus de diffusion. 

Soicnt données des fonctions c{x) == 0, ax) = (a'(x), ..., a"(x)) et 
une matrice b{x) = IIb/(x)Il, 5,7 = 1,2,...,m,x€ R®. Supposons que 
sont réalisées les conditions : 

A) les fonctions «(x), b{(x) et c(x) sont bornées et vérifient la condi- 
tion de Hôlder sur R® (une fonction f(x) vérifie la condition de Hôlder 
sur R® si existe des constantes positives X et «, telles que 


f)-/O)l <= KIx-yls, x,» ER; 


B) il existe une constante » _- O telle que pour tous les x € R® et 
UE R" 


(4 x)0, 0) — b> D) > p|0F ; 
.j—1 


C) c(x) == 0 pour tous les x € R*. 

Théorème 2. Supposons que sur R* sont données des fonctions a(x), 
b{x), c{x), vérifiant les conditions A), B), ©). I existe alors un processus de 
diffusion (£(), EN, P,) à valeurs dans l'espace des phases (R*, 8), pour 
lequel 

- O*f(x) € Of (x) 
\ -) —- : 1} ER È à RÉRRSS 7 FT . 
HS (x) 2 on b at as ! à «(x) au (x) JO), 
où J € D£ et est l'opérateur caractéristique du processus (£(), 8, À,, P,). 


Le semi-groupe correspondant au processus laisse invariant l'espace C(R®) 
(COCR®) est l'espace des fonctions continues sur R° tendant vers O pour 
[x] -> oo). Pour toute fonction f(x), x € R”", bornée, deux fois continfiment 
dérivable, la fonction 


u(s, x) = E,f(S0)) = TS) 


est deux fuis continiment dérivable par rapport à x, dérivable par rapport à t et 
satisfait l'équation 


Ou 

= Wu 1-0,  xER" 

(]) | 

avec la condition initiale Wim ut, x) — J(x). La probabilité de passage 
1,0 

PG, x, 0") du processus admet la densité G(, x, »), 1 7-0, NX,» ER", par 
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rapport à la mesure de Lebesgue dans R“, et de plus, G(, x, y) est solution 
fondamentale de l'équation 


= Vu. 


La démonstration de ce théorème cst basée sur les propriétés des 
solutions fondamentales des équations paraboliques. Au chapitre 19 on 
examinera d'autres méthodes de construction de processus de diffusion. 


15.7.3. Exemple prouvant l'existence de processus muarkoviens continus 
qui ne sont pas de diffusion. 

Définissons une famille d'opérateurs 7,1 - 0, agissant dans l'espace 
BCR!) par la formule 

] Cy—x}) 
TS) — À -,:- exp { ; , JOv)dv tr 
s/2:1 21 
#1 


; (CHE 

4 e  # [fO)-/C-v)dy, xER!'S  JSERR, 

V2 
on 

où cest un nombre réel quelconque, [ec] -: 1. On peut montrer que la 
famille d'opérateurs {7,, 1 — 0} forme un semi-groupe d'opérateurs auquel 
est associé un processus markovien continu (£(r),%!,, P,) à valeurs dans 
l'espace (R', À). Pour « — 0, c'est un processus \wvienérien. Pour « := 1, 
avant Île temps d'entrée dans l'intervalle ]0, [ ce processus se conduit 
comme un processus Wwienérien, après ce temps, comme un processus wiené- 
rien avec réflexion en 0. Ceci vaut également pour c - —1. Pour 
0 -— |e| = 1, on obtient des processus « intermédiaires ». 

On démontre sans peine que si la fonction /(x) est deux fois conti- 
nüment dérivable au voisinage d'un point x, Z 0, alors / € DS et (Vo) 
S L''UX), où est l'opérateur caractéristique du processus. Si /(v) 
est deux fois continûment dérivable au voisinage du point x — 0, alors 
pour cÆO0/ED,, dans le cas seulement où /’(0) — 0, Y/(0) - 
— 1/2/'"(0). Donc, le processus considéré n'est pas de diffusion pour 
ce # 0. La propriété de ce processus d'être de diffusion est violée au point 
x — 0. 

Le processus considéré est un processus de diffusion général au sens 
suivant. Posons 


ai, X) — , E,(£U)- x) - L | Cy— x) PI, x, dy) : 
Pt 
Hi, x) — : E (CG) x) ] On) PU N, dv), 1-0, ve Rt. 


ne" 
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Alors pour toute fonction continue à support borné 4x), x € R!, 
lim f4Q) ar, x) dx = cg(O0). 
#0 R! 


Pour la fonction b{s, x) on a 
lim br, x): | 


pu 


pour tous les x € À!, et de plus (1, x)1 = K° pour tous les x € R!' et 
1 = 0, où À'est une constante. La première de ces expressions signifie que 
le «coefficient de transfert » du processus considéré est égal à cô(n), 
où Ô(x) est la fonction de Dirac. La deuxième relation montre que le coeñii- 
cient de diffusion est égal à 1. 


15.8. Processus continus sur une droite 


15.8.1. Points réguliers. Le fait que la droite R! est un ensemble ordonné 
nous permet de décrire tous les processus markoviens forts continus à 
valeurs dans R!. 

Soit (£(), À, P,) un processus markovien fort continu dans un inter- 
valle À € R!. On dit qu'un point » € 1 est accessible à partir d'un point 
NEA si P,{r, <= æ} = 0, où r, est le premier temps d'accès du point 
y (%, cst un temps d'arrêt). Désignons par 4, l'ensemble de tous les y € ;1 
accessibles à partir de x. 1, est un intervalle (fermé, ouvert au semi-ouvert, 
fini ou infini). Le point € -l est dit régulier si : 

1) x est point intérieur de l'intervalle A, : 

2) existent des x,,.v4 € 44 tels que x, -- NX = x, et x est accessible à 
partir de x, et de x. 

Le théorème suivant nous renseigne sur le comportement du processus 
en un point régulier. 

Théorème 1. Si x ess un point régulier, alors pour tout 5 — 0 


"| sup  Ë(s) :- « 1, 2 inf  £(s) <— à = À; 
CEE, Os <0 


15.8.2. Processus sur un intervalle fermé. Décrivons tous les processus 
markoviens forts continus sur un intervalle ]x, [ en supposant que tous 
les points de cet intervalle sont réguliers, & et f? accessibles de l'intérieur 
de cet intervalle et tout point «x € Jx, f[ accessible à partir deœet BP. Dési- 
gnons par à le temps de première sortie de l'ensemble ]«, f[. Alors ou bien 
EC) — x, ou bien £(£) = f. Posons mx) = P,{5(0) = P}. 

Théorème 2. La fonction m{x) est continue, strictement monotone crois- 
sante et m(&) — 0,m(p) = 1. Le processus {m(é(min (1, E)) —m(E(0)). À, P,)} 
est une martingale continue de carré intégrable dont la caractéristique est 
une W-fonctionnelle du processus (Ë(),R, P,). 
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De ce théorème il résulte que si l'on transforme l'espace des phases à 
l'aide de la fonction #1(x), on obtient sur [0, 1] un processus pour lequel 


mN) =: NX. 


Supposons qu'on ait effectué ce changement, donc qu'on étudie sur 
(0, 1] un processus pour lequel 


PAG) = 1}::x3 PAC) -0}=- 1 -x. 


Considérons la fonction #(1) = E.é. On démontre que la fonction 
E, êt est bornée sur [0, 1] pour tous & == 1,2, .... Il cest immédiat de vérifier 
que (x) cst une fonction strictement convexe vers le haut et si 7 est le 
temps de première sortie de l'intervalle }x,—e, vo +0 (0 < x0—E < xy+ 
40 <1,e Ô > alors 


Ô ë 
= H(Xo) (No €) Là Ho | Je 5 
Comme 


E,o/ ($ (r)) : - f(Xo— E) re + /(Xo 1 9) . 


on obtient alors pour l'opérateur caractéristique au point x, € ]0, I 


| & (ve 6) f(x] + 8 Co + 8) —S Cr0)] 
GE ET Rd = nQ0+ De fiRo—0 =] ‘ 


On remarquera qu'il existe la dérivée #"(x), fonction décroissante de x. 
On démontre par ailleurs que si la fonction /'(x) est absolument continue 
ct si existe pour clle une fonction continue g(#), telle que 


S'Q) = J"0)+ [ 80) du), (8.1) 


alors pour tous les x € ]0, I[ 
AJ = 4x). 
| | perte me. A 
La fonction g(r) satisfaisant (8.1) cest la dérivée dO : Donc, 
pour x € J0, Il 
oc …- 20) 
J() dn'(») 


l'opérateur caractéristique étant défini sur toutes les fonctions / (x) abso- 


d 
lument continues ct possédant une dérivée _. continuc. Notons enfin 


que si le processus s'arrête au temps de première sortie de l'intervalle 
10, 1[, alors son opérateur infinitésimal À est défini sur toutes les fonctions 
df"(x) 


absolument continues f pour lesquelles dr est continue sur [0,1] 
et /(0) = /(1) = 0. De plus, AS = AJ. 
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15.8.3. Processus sur un intervalle de régularité. Soient (£(1), ,, P,) un 
processus markovien fort continu dans l'intervalle .1:= R!, x €.l un 
point régulier pour ce processus. Posons 


4 — inf {v: LS . ls P{r, he œ} Le 0} , 
B — sup {r . V És l, Pr, ne a} 5 0}. 


Le point x étant régulier, l'intervalle zx, ff n'est pas vide ct contient x. 
On l'appelle intervalle de régularité du processus, contenant le point x. 

Voyons comment se comporte le processus dans un intervalle de régu- 
larité dans le cas où les points « et f ne sont pas réguliers. On distingucra 
quatre cas pout la borne « de l'intervalle }x, f[: 

1) le point « est accessible de l'intérieur de l'intervalle ct tout point 
NX € Jr, f[ est accessible à partir de & ; le point « s'appelle borne régulière ; 

2) le point « est accessible de l'intérieur mais les autres points de 
l'intervalle ne le sont pas à partir de &. Dans ce cas « s'appelle borne 
captivante ; 

3) le point « n'est pas accessible de l’intérieur mais les points de l'inter- 
valle le sont à partir de « ; un tel point cst appelé borne relaxatrice ; 

4) le point « n'est pas accessible de l'intérieur et les points de l'inter- 
valle ne le sont pas à partir de « ; ce point s'appelle borne naturelle. 

Ceci vaut également pour la borne f. 

Supposons que « est unc borne régulière. Le point & n'étant pas régu- 
licr (au sens de la définition précédente), pour tous les y -: &«, € ou 
bien P,{r, - «} =: 0 ou bien P.,{7, < } := 0. Dans le premier cas « est 
dit inaccessible à gauche, dans le deuxième cas infranchissable à gauche. 
Une borne régulière infranchissable à gauche « s'appelle borne réfléchis- 
sante. Le théorème suivant nous donne la forme de l'opérateur infinitésimal 
d'un processus avec deux bornes réfléchissantes. 

Théorème 3. Si (Ë(r), ñ, P,) est un processus sur [0,1] pour lequel 
mx) == x et les points 0, 1 sont des bornes réfléchissantes de l'intervalle de 
régularité JO, 1(, alors en tout point x € J0, 1 


 . dJ'{x) 
AJ (x) - di” 
et aux bornes | | | 
A1 (0) -- lim A au . AJ) -- lim AUECUE RON é 
€ {0 E,r, € 10 Er, € 


D4 étant confondu avec l'ensemble des fonctions pour lesquelles AJ est 
continue. 

D'autre part, si les bornes de l'intervalle ]0, 1[ sont captivantes, il est 
naturel de considérer que le processus s'arrête à l'instant de première sortie 
par une borne. Donc l'opérateur générateur d'un tel processus sera de la 


forme 
af’) 


MO ED 
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et de plus, JE D, si (0) = JU) = 0, ZX) est absolument continue ct 
dJ'(x) 
dn'(x) 

Supposons que les bornes ne sont pas accessibles. Le processus reste 
alors toujours à l'intéricur de l'intervalle de régularité. On démontre qu'il 
existe une fonction harmonique continue strictement croissante Af(x), 
x E Je, fi, telle que toute autre fonction harmonique g(x) soit définie 
par l'égalité g(x) = c,M(x)+c,, où ce, et ce, sont des constantes (une 
fonction f(x) est dite harmonique pour un processus (Ë(r), N,, P,), si 
le processus ( JO), À, P,) est une martingale, c'est-à-dire 7,/(x) = 
— JR). L'application y — Af(x) de l'espace des phases associe au proces- 
sus initial un processus défini sur un intervalle (fini ou infini) pour lequel 
M{(X) = x. On admettra que cette opération a déjà été réalisée. 

Il existe par ailleurs une fonction N(x) convexe vers le haut telle que 
pouraæa = \—e-. x = N+0 < f 


continuc sur [0, 1]. 


Ô € 
E,r = NOx)—-- NN —E)—- "NON F6), 
ut = NU) ea (N — €) Pos: (x +9) 
où 7 est le temps de première sortie de l'intervalle ]x -e, x 1 0[. On peut 
maintenant représenter l'opérateur caractéristique du processus sur l'inter- 


valle Jx, f{, «, ff étant des bornes inaccessibles (A/(x) = x) par 


dj) 

dN'(x) 
pour tous les points x € Jx, fi. L'intervalle Je, f{ étant un espace localement 
compact, l'opérateur infinitésimal du processus peut être déterminé par 


application du théorème 3 du n° 15.3. 
On dit qu'une borne inaccessible «& est attractive si pour tout € = 0 


HZ (NX) = 


il existe Ô:-0 tel que P,f lim (4) = &œ? = 1—e pour tous les 
> 
\ € Ja, «+ Ôô[ ; répulsive si P,{r, -:<} = 1, pour tous les & -- x, = x. 
Théorème 4, Une horne à est inaccessible SO NCH@) = — co. Ceci 
étant, @ est une borne attractive si MY) = —- ct répulsive si 
MC) = — co, 


15.8.4, Points non réguliers. Etudions le comportement d'un processus 
aux points non réguliers. Si x est un point non régulier, l’une au moins 
des conditions suivantes doit être réalisée : 

(D) P,{r, = } = 0 pour tous les y < x (le point x est infranchis- 
sable à gauche) : 

(ID) P,{7, <= } = 0 pour tous les y > x (le point x est infranchis- 
sable à droite) ; 
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CD) P,fr, -...) O0 pour tous les v - 4 (le point x est inaccessible 
à gauche) : 

CV) P,{r, -. 5) 0 pour tous les x _- x (le point x est inaccessible 
à droite) ; 

Si le point x est infranchissable à gauche cet à droite, il est absorbant 
et l'on a N/(x) = A/(x) = 0. 

Supposons que (1) est réalisée et que (H) ne l'est pas (C'est-à-dire le 
point x est infranchissable à gauche mais franchissable à droite). Si r° est 
le temps de première sortie de l'intervalle ]x —e, x +-e[, alors 7° = r, ,,P,.- 
presque sûrement. Il existe une fonction monotonc g(r) telle que E,r‘ — 
== g(x)—g(x He). Dans ce cas donc 

.…. AXE) JUN) 

y - PE ÉRRRRS 

7 (1) Eu A) 
De façon analogue, si (1D est réalisée et (D ne l'est pas, alors 
SX -E)-J(N) 
y 2: . 
H/ (x) qu O2) 
c'est-à-dire dans ces deux cas le calcul de l'opérateur caractéristique se 
ramène au calcul de la dérivée unilatérale de la fonction (x) par rapport 
à une fonction monotonc. 

Supposons que les conditions (1) et (IL) ne sont pas remplies. Si (II) 
a lieu et ([V) n'a pas lieu, alors x est la borne gauche de l'intervalle de régu- 
larité : ce cas a été cxaminé plus haut. Si au contraire (IV) est réalisée ct 
(HD) ne l'est pas, alors x est la borne droite de l'intervalle de régularité. 

Supposons maintenant que (IL) et (1V) sont réalisées et (1) et (IE) ne 
le sont pas. Si x n'est pas inhibitif, alors, en sortant de x, le processus sera 
tout le temps ou bien à gauche de x ou bien à droite. Posons 


p= PA{EG) = x}, Vvt=-0; 
q =: PAS) = x},  Vt > 0. 


Détinissons les fonctions 


l . Le. 
gi») - D E,rCyy, «1 (C9) : 


1. 
gr) -- à Et", co, n (CR). 
pour @ = 0. La fonction g,(y) décroit sur l'intervalle [x, x 4 p], g-0>) croit 
ur [x —0, 0]. En À l'opérateur caractéristique s'écrit : 


pra to PU +0)-S 0] + Alf 0) -f a) 
ACTA CET CET) ENT CET 7 CET) 


Chapitre 16 
PROCESSUS À ACCROISSEMENTS INDÉPENDANTS 


16.1. Définition et propriétés générales 


16.1.1. Définition. Exemples. On étudiera des processus (1) à valeurs dans 
R", définis sur un intervalle T fini ou infini. On dit qu'un processus est à 
accroissements indépendants si les variables aléatoires 


Elo), EC) —E (to), - - . EC) — EE, 1) 


sont indépendantes pour tous les t5 <t1 = ... <1,. Les lois finidimension- 
nelles du processus £ (1) sont ee mé par les lois des variables 


EG), 1ETet É(ts)—-E(t;), li < ta, 
Si F(r, A) = P{É(G)E A}, Gt, * D = P {Ë(t2)— (1) € A}, ti<ta, 
alors pour fi <fs< ... <f, 


F,, PAGE .., À) == P{É()E A, ... Ë(,) € À,} = 
= [Sara GnraGitxs) se La Cite. +) F, (Ax)X 
XG(las las Axa) +. Gr lus dXn). 


Soient ,(z) = E exp ti: E())} Pur, (2) = E exp {i(z, £(12)—E(:))}, 
zE Re, les fonctions caract ristiques du processus et de son accroissement. 
La fonction caractéristique conjointe des variables Ë(r,), ..., E(r,) est 
alors définie par 


E cxp ! È (Ë(), 7) = Pat... +z)X 


X Ps ta tee Hz) ee Vins 1x (Zn)e 


Les fonctions y,(z) et y, , (z) sont reliées entre elles par les équations : 
) pour f; <fs 


Pu(2) Pit (2) Fe Pr, (2) , 
2) pour; <ts<ts 
Pris ts (2) Pis 1 (2) = Pru ts (z). 


Un exemple simple de processus à accroissements indépendants nous 
est donné par toute fonction non aléatoire. 
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Indiquons un autre exemple important. Soient {5} et {EF} des suites 
de vecteurs aléatoires de R" indépendants dans leur ensemble, telles que 
les sérics 


convergent pour toute suite de nombres naturels x, (cf. n° 3.2) et #, une 
suite quelconque de récls. Posons 


= Y'ér Y à. (1.1) 


Ce processus possède les propriétés suivantes : 1) il est à accroissements 
indépendants ; 2) il est stochastiquement continu pour # 4 {#,, 12, ...}; 
3) les limites stochastiques de £(r,—0) et £(r, +0) existent pour tous les 


1, ct 
PÉG)-EG-0)= ET} = 1 ; 4.2 
P{ËG+0)-E() = £#} = 1 ; 

4) si () est un processus séparable (ce qu'on peut toujours admettre puisque 
la relation (1.1) définit un processus à l'équivalence stochastique près), 
les réalisations £(1) sont presque sûrement continues en tous les points 
hormis les points #,; les limites de £(r,—0) et £(1, +0) existent en r,. et 
(1.2) est réalisée pour ces limites. 

Les processus de la forme (1.1) sont appelés processus discrets à 
accroissements indépendants. 


16.1.2. Décomposition de Lévy. Pour tout processus à accroissements 
indépendants Ë(t) il existe une fonction non aléatoire a (1) définie sur T ct 
à valeurs dans R” telle que le processus Ë,(1) = £(1)—a(r) : 1) ne possède 
pas presque sûrement de discontinuités de seconde espèce à l'interieur de 
T ; 2) admet en tout point des limites stochastiques à gauche et à droite ; 
3) possède un nombre au plus dénombrable de discontinuités stochastiques 
de seconde espèce. 

La fonction a(t}) qui possède les propriétés indiquées est dite fonction 
de centrage pour un processus à accroissements indépendants. Cette 
fonction n'est pas définie de façon unique : deux fonctions de centrage 
quelconques diffèrent entre elles d’une fonction ne possédant pas de dis- 
continuités de seconde espèce à l’intérieur de T. 

Si (4) est un processus symétrique, alors la fonction de centrage peut 
être prise identiquement nulle. 

Supposons que a(t) est une fonction de centrage pour un processus 
ÉG)et &,() = Ë(G)- ar). Désignons par {r:, /2,...} l'ensemble des points 
de discontinuité stochastique de £,(r), £ = 5, (a +0)-£, (0), Ër = Ë, (4) — 
—&,(—0). Les variables {£f ; &5 ; k = 1, 2,...}sont indépendantes dans 


leur ensemble ct 
&G)= D Et+ Y x 
(Ex <t IE =! 
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cst un processus discret à accroissements indépendants. Le processus 
&,() = É1(@)-£,(r) ne dépend pas du processus &,(r) et, de plus, £,(r) est 
stochastiquement continu. Donc, pour tout processus à accroisssements 
indépendants é(r), on peut exhiber une fonction non aléatoire 4(t), un 
processus discret à accroissements indépendants &,() et un processus 
stochastiquement continu à accroissements indépendants £ (r), tels que 


&(r) = ar) +40) +60), (1.3) 


les processus &,(1) et &.(t) étant indépendants. L'expression (1.3) s'appelle 
décomposition de Lévy pour un processus à accroissements indépendants. 
Si la fonction de centrage a(t) est donnée, les autres composantes de la 
décomposition se définissent de façon unique. 


16.1.3. Quelques inégalités. Soit £(f) un processus à accroissements indé- 
pendants pour lequel E(£(r), z)° < pour tous les 2€ T, et a(r) = EË(r). 
La fonction a(r) est de centrage. Désignons par Z(t) l'opérateur symétrique 
dans R" pour lequel 


(B(:)z, z) = E(Ë(r)— ar), zŸ°. 


Alors B(t) n'est pas négatif et comme fonction de # n'est pas décroissant. 
Donc, B(t) est borné sur tout intervalle fermé à droite de T. 

Généralisation de l'inégalité de Kolmogorov aux processus à accrois- 
sements indépendants. 1) Si £(+) est un processus séparable à accroissements 
indépendants et [a, b] ET, alors 


: Tr B(b) 
P{ sup 180) di ><} < 5, (1.4) 


où Tr B est la trace de l'opérateur B : Tr B= Ÿ (Be,, e.), où {e:, k = 
k=mi 
= 1,..., m1} est une base dans R®. L'inégalité (1.4) vaut aussi pour T : 


1 
P {sup HOBIOIE c} < 2 B(t). 


Les processus séparables à accroissements indépendants sont justi- 
ciables d’autres inégalités classiques pour les sommes de variables aléa- 
toires indépendantes. 

2) Si E(t) est un processus séparable symétrique, alors 


P{ sup 180)! > c} < 2P {1£(6)I > c}. 
3) Sipouruna<lettE (a, b] 
P{I£@)-E(G)1 > c}< 0, 
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alors pour tous les X > 0 
2 | _ 
P{ sup [é()l--c1 x} 2 P{IS(O) | SENTE 
Cle, b) 1 --@ 


4) Si È(r) ne possède de discontinuités de seconde espèce et P {sup LÉ + 
+0}-E(G—-0)1< c}= 1, alors pour tous les l'et a on a 


1 1 
D 
Opera @+0z 


1—4P{I£4)1 > à) 


1—-4P{ISG)! => a} 


I 
si seulement VP{E(G)| > a} < — et | 2! < 
{15 )| } 4 € | | a+c 


16.2. Processus stochastiquement indépendants 
à accroissements indépendants 


16.2.1. Propriétés desréalisations. I. Un processus séparable stuchastiquement 
continu ne possède pas presque sûrement de discontinuités de seconde espèce. 

II. Pour qu'un processus séparable à accroissements indépendants 
&(t) défini sur (a, b] soit presque sûrement continu, il est nécessaire et sufñi- 
sant que pour tout e > 0 l'on ait 


CAL 


A —+ kmO0 


OÙ Lio << res < lun = D € Max (af) 7 0 pour n-#00. 
& 


III. Si Ë(t) est un processus séparable à accroissements indépendants 
sur [a, b] pour lequel P {£(b) = £(a)} > 0, alors £(t) est presque sûrement 
une fonction en escalier, c'est-à-dire l'intervalle {a, b] peut être décomposé 
en un nombre fini (aléatoire) d'intervalles aléatoires sur chacun desquels 
Ë(t) est constant. Inversement, si E(t) est presque sûrement une fonction en 
escalier sur (a, b], alors P{Ë£(b) = (a)} = 0. 

IV. Pour qu'un processus séparable numérique à accroissements indé- 
pendants Ë(t) soit presque sûrement non décroissant sur [a, b], il est néces- 
saire et suffisant que P {Ë(b) > E(a)} = 1. 

16.2.2. Formule de Lévy-Khintchine. £ (f) est un processus stochastiquement 
continu à acvroissements indépendants défini sur [4, b] à valeurs dans 
R®. Pour ce processus il existe alors : 1) une fonction continue a(t}, t € [a, 
b], à valeurs dans R" ; 2) une fonction continue B(#), 1 € [a, b], dont les 
valeurs sont des opérateurs non négatifs symétriques de R" ; 3) une fonc- 
tion ZJ(1, À), 1 € [a, b], définie pour tous les boréliens À de R” situés à une 
distance positive de 0 et tels que a) ZZ(t, À) est une fonction continue 
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non décroissante de #1 ; b) FI, À) est v-additive par rapport à 4, à re 
: ane x ff | 

€ [a, b] fixe ; c) l'intégrale Î 1 : Le TI(1, dx) étendue à R°" privé du 
41. 

point 0 cst finie. La fonction caractéristique de l'accroissement du proces- 
sus est indéfiniment divisible (cf. n° 5.2.2) et s'exprime par la formule : 
poura=t<s<b 


E exp {i(:, £(s)— ())} = exp {ie a(s)—a(t))— 


I s,£ (2, : 
= ([8(5)- BG] 2, )+[ (er 1 EE) x 


X(/T(S, dx) IT, ax)}}, (2.1) 


apprléc formule de Lévy-Khintchine. Les fonctions a(+), B(#), IT(r, À) de 
cette formule se définissent de façon unique. 


16.2.3. Construction d’un processus stochastiquement continu à accroisse- 
ments indépendants. Soit &(1) un processus séparable. Ce processus ne 
possède pas de discontinuités de seconde espèce et, par suite, le nombre 
de sauts supérieurs à € en module est fini sur tout intervalle de temps 
fermé fini. Désignons par v(r, À), où À est un borélien de R" situé à 
unc distance positive de 0, le nombre de sauts du processus £(s) (on appelle 
saut en un point s la quantité #(s +0) — £(s — 0)) ayant eu lieu avant l'instant 
set tombant dans l’ensemble À. »(#, À) en tant que fonction de f est un 
processus de Poisson, c'est-à-dire »(#, 4) est un processus stochastiquement 
continu à accroissements indépendants, admettant pour chaque # une 
loi de Poisson. Si t est fixe, v(r, À) est une mesure poissonnienne à valeurs 
indépendantes. Cela signifie que sont réalisées les conditions : 1) 


y (c U 4) = D rs, A1) si 4, sont des ensembles deux à deux disjoints 


et U A, est situé à une distance positive du point 0 ; 2) si A,, Ag, ..., An 


sont des borélicns deux à deux disjoints, alors les processus r(f, 4,), ... 
.…, v(t, À,) sont indépendants dans leur ensemble. 
La fonction ZI(r, 4) = Ev(t, À) est celle qui figure dans la formule 


de Lévy-Khintchine. Définissons les intégrales | [ xt, dx), 
Izl>1 
[  xbr@dx)-H(G, dx)}= lim [xt dx)-11(, dx)] 
0<|r|«l e—æ0s|<7z|<1 


(les limites sont comprises au sens de la convergence en moyenne quadra- 
tique). Alors le processus 


EG) = EG [ xrG, dx) | xt, dx)— IT, dx)] 
|z]>1 0<]z|<i 
est presque sûrement continu et ne dépend pas de v(#, 4). 
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Soit (1) un processus presque sûrement continu à accroissements 
indépendants. £,(1) est à accroissements gaussiens, c'est-à-dire £o(12) — 
(4) admet unc loi normale. La fonction caractéristique de l'accrois- 
sement du processus &,(1) est de la forme 


E exp {i(z, nie AUDE 
== Cxp {G. a(t2)— a(t,))— LI  ((BG:)- BG) Z, :)} , (2.2) 


où a(t) = E(£o()—£Eo0)), (BU)z, 2) = E(£o(U)—Ëo(to), z)?, et f, le point 
minimum de 7. 

Donc, un processus stochastiquement continu à accroissements indé- 
pendants Ë£ (1) est justiciable de la représentation 


EU)= &U)E À xd, dx)]t [ xvG dx), (23) 
[rl «1 {r| > | 


où r»(#, A) est une mesure poissonnienne à valeurs indépendantes par rapport 
à À et un processus poissonnien par rapport à #, Z1(t, A) = Ev(r, À) et 
£o(f) un processus continu à accroissements gaussiens, indépendants dont la 
fonction caractéristique est définie par (2.2). 

Signalons quelques relations entre les propriétés des fonctions du second 
membre de la formule de Lévy-Khintchine ct les propriétés des réalisations 
du processus Ë (r). 

I. Le processus E(t) est continu si et seulement si IT(t, À) = 0 pour 
tous les t € T'et les boréliens À de R”. 

IL. Soit 77(r, R®) = cn IT(t, R°\S,), où S. est la sphère de R” de 


rayon € centrée en ©. Cette imite peut être infinie. Pour que le processus 
E(t) soit en escalier, il est nécessaire et suffisant que : a) a(t) soit constant ; 
b) B(t) = 0 pour tous les ET ; c) I1(1, R°) << pour tous les 1 ET. 

LE. Pour que le processus à (1) soit presque sûrement à variation bornée 
sur un intervalle {t,, 1], il faut et il suffit que a) a(t) soit à variation bornée 


sur (fo, 41] ; b) BC) — B(t0) = 0 ; C) f lx1(Z7G, dx) IT(to, dx)) <<». 


lsl=: 
Sic(t)est la variation de £ (4) sur l'intervalle (to, t ], alors & (1) est aussi 
un processus stochastiquement continu à accroissements indépendants dont 
la fonction caractéristique est de la forme 


Eco = exp {12p)+ [Get 1) (77, dx) Ho, dx)}}, 
où y(r) = va A f [x | (27, dx) = IT, dx)) est la variation de 
a(-) sur} intervalle [lo, !']. 
IV. Soit K un cône de R* centré en O. Pour que È(t) € K,1 ET, presque 
sûrement, il est nécessaire et suffisant que a) a(t) € K pour t ET ; b)B(t) = 0 
pour t€T;c)si ANK= G, alors 11(1, À) = 0 pour tous les 1 ET. 
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V. Soit £(r) à valeurs dans RÀ!. Pour que Ë(t) soit presque sûrement une 
fonction non décroissante, il est nécessaire et sufisant que : a) a(r) soit une 
fonction non décroissante ; b) B(t) = 0 pour tous les t ; ©) II(1,]— ©, Q) = 0 
pour tous les t. 


16.3. Processus homogènes. 
Propriétés asymptotiques 


16.3.1. Fonction caractéristique d’un processus homogène. On dit qu’un 
processus à accroissements indépendants £ (1) est homogène s'il est défini 
sur [0, cf, £(0) = 0 et si la loi de £(1 +) —Ë(r) est confondue avec celle de 
& (hi) pour tous les ? > Oet À > 0. Tout processus homogène à accroissements 
indépendants £ (r) s'écrit sous la forme 


£({)=at)+6,(), 


où &, (1) est un processus stochastiquement continu à accroissements indé- 
pendants ; a(t) une fonction non aléatoire telle que a(t +) = a(t)+a(h) 
pour tous les 4 > 0,1 > 0. 

Si £(#) est un processus homogène stochastiquement continu à accrois- 
sements indépendants dans R”, alors sa fonction caractéristique est 


Eeitr.€9) — exp { k (z, + (Bz, z)+ 


+ femr-1-Go)nan+ | ev?-1 LE) | G.) 
lx] <i Iz1>1 


où a€ R®: Best un opérateur non négatif symétrique dans R° ; 77 une 
mesure dans R” telle que 


(x, x) 


ES [T(dx)<c et II({0}) = 0. 


Le processus étant homogène, le second membre de (3.1) est également 
fonction caractéristique de l'accroissement Ë (+ )—£(h) pour tout A = 0. 
Il ressort de la formule (3.1) que la quantité 


K(2) = + In Eet@. &t0) 


ne dépend pas de s. On l’appelle cumulant du processus homogène à accrois- 
sements indépendants. Le cumulant d’un processus définit toutes les lois 
finidimensionnelles de ce processus. 


16.3.2. Propriétés locales des processus de dimension un. On admet dans 
ce numéro que Ë(r) est un processus homogène dans À’. La fonction carac- 
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téristique de ce processus est 
Ee 0 exp [ si = ue | (e/4:- 1 5x) (dx) + 
ME 1 


Li 
I:l>1 


4 | (er ] LA) | (3.2) 


Etudions le comportement de à (1) pour 1 10. 
I. Si l’une au moins des quantités 


.— | .… | 
lin E(), lim Ë() 
uo uo 
est finie avec une probabilité positive, alors £ (1) est presque sûrement à 
variation bornée sur tout intervalle fini et par suite (cf. n° 16.2.3, TITI), b = 0 


ct f Lx t 77(dx) < os. Dans ce cas 
Is|<t! 


1 
lin 3 EG) - a- [+ nus] == 1, 
uo À 
1 
I. Si est réalisée l'une des conditions suivantes : 1) b—0; 


1 
2) flxi//(@dx) — 1, alors 
--1 


P {im EU) = | } =: P {lim LS) =- -œ} = f, 


4,0 710 
in. P Jim 2 so V6] = p Jim - -—- ex 
un à 
| a/2 Inn ; Lis 2Inin " 


X (1) vol = 1 (loi locale du lugurithme itéré). 


| 


LV. Soient à (1) un processus non décroissant de cumulant 
K(z) = [ Ce“*-1)11(dx) 
0 


ct g(x) unc fonction non décroissante définie pour x = 0 et telles que : 
1) g(0) = 0 ; 2) g(xv+») <g(v)+g(y) (la fonction g est semi-additive). 
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Dans ces conditions 


: 


a) si ] gON) Hd) =, alors P {lim AC Le 0} : 


jo 
u 


b) si Î gx) AI(dx) = 1e, alors P {im LIL +œ| L: 
0 


QU 


V. Supposons que y (1) croit sur [0, 1]Jet 


à (URL 
lin sup el 
ui t pt) 
Supposons que (1) est un processus homogène à accroissements indépen- 
dants tel que pour tout # - 0 


sup P{5(4) < -ep(t)} < 1. 


O-540<1 
Sous ces conditions : 
[ 


1) si [ P«s0) - p()}dt <o, alors 


P {lim a <1}-1; 


2) si ] ; P{E(G) = pG)}dt - >, alors 


P {lim $Q) DE [. 
140 pt) 
VL. Soit & (4) un processus stable de cumulant 


KE)-=-elzl (1 + e(z, ”) ; 


où (7,4) B,* pour 4€] 1, 2, oz, &): -— 2 In lzl pour «=. 1" 


Ce processus ne possède que des sauts négatifs. son 


a—-1 
pt) = 0 as) qua [in In 7 | pour «a€]l,2{; 


cos el 


2ct Î 
p(t) = cm  APOUE Er Il. 
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Alors 
(< 
p {lim sue 1} : 
no FT) 
VIL. SiË(r)est un processus monotonc stable de cumulant 


K@=-clzl8 (1-5 &3c), O<a<l], 


alors 
| = 


| | ar 
P in Ë( | (»” [in In | > ù =], 


16.3.3. Comportement des processus de dimension un pour /-°. On 
conserve les notations du numéro précédent. 
I. Lol forte des grands nombres. 1) Si existe E £(r) == 7, alors 


P { lim … =. ») = | Ê = a+ É 11(dx) + f X ns) . 


1— © 
- [| 


2) Si f NIT(dx) :- - so, Î NITI(dx) - +, alors 
nl 1 


P {lim UE m} = 1. 


1 —+ co 
—1 œ 
3) Si f xx): 0, ( x IT(x) < 1e, alors 
DS 1 


P { lim Leu) _ wo} D 
1 — © { 


II. Conditions pour qu'un processus soit borné sur [0, {. 1) Si 


E &(1) < 0, alors eur c() “| = |, 
P {inf &() = ->} se 
2) Si Eë(1) = 0, alors P {sup &() 2 + co} =. 
LU 


P {inf &«) = -o} a: 
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3) Si EË(t) -- O0 es E(t) À 0, alors 


P {su Gt) — 1 co} = P {int £u) … -e) =. |. 
t t 


4) Pour que P {sun Ê(4) <+ e — À, dl est nécessaire ct suffisant 
! 


que 
0 I L 
| PAG) > 0} di <e, 
0 
5) Pour que P {inr È(1) -- -»} = À, il est nécessaire et suffisant 
{ 
que 
e ( . 
| _. P{E() < 0} dt <es. 
0 


DL. Soient E(t) un processus non décroissant de cumulant 
K(:) — Î (c=*— 1) /1(dx), 
0 
gx) une Jonction non décroissante telle que g(x+y) < g(x)+8(y) pour 
X>0, y > 0. 
1) Sr f g(X) LT (dx) <>, alors 
(| 
P{ lim : g(£t)) — 0} — À. 
te 
2) Si f gx) LT (dx) — Lo, alors 
! 
P{ lim . g(£G)) = 1 } EE À 
1 — 


IV. Loi du logarithme itéré. Si EË(t) = 0 et Var E(t) <c, alors 
Varë(t) = 10, où c = b+ [ x*I7(dx) et 


lin 0. = Pin = ir ie D . 
+ \/2ct Inint 1 V2ct Mint 
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16.4. Fonctionnelles de processus 
à accroissements indépendants 


16.4.1. Equation intégro-différentielle de processus. Soit £(1) un processus 
à accroissements indépendants sur [f0, ?,] à valeurs dans R”, dont la fonction 
caractéristique est de la forme 


t 
E exp {i(z, £(1))} = exp Î use + (B(s)z, z)+ 
le 


1 fee ) fs dant 
DEL 


J (et) 1) ÎT(s, dx) cl / (4.1) 

rl =- 1 : J 

où d(s) € R", B(s) est un opérateur symétrique non négatif de R°, îl (s, 4) 

unc mesure dans 2" telle que f [x {°7Z(s, dx) << pour s€f[to, fil. 
\s|1<1 


La fonction caractéristique du processus peut être mise sous la forme 
(4.1) si les fonctions a(s), B(t) et Z1(+1, A) entrant dans la formule (2.1) sont 


absolument continues par rapport à . Supposons que 4(t), Br), fI(t, À) 
ct Î 1x1 /7(r, dx) sont continues par rapport à #. Alors la fonction 


Isl<1 
ES (x+8()) =: «fr, x) 
cst solution de l'équation intégro-différenticlle suivante pour #1 C[1,, t,]: 


ue X) (4.2) 


avec la condition aux limites lim «(s, x) :- (x), quelle que soit la fonction 


ŒU 
deux fois continüment dérivable J de dérivées bornées, où 
Le Le 
L,u(s, x) : a" (4 L 
ti, X) à (4) 


| Ou, x) | so 
à ve b#(r) - ati au | : Le lv) 
spi=t 

— SN) - >. 2e. »| 2, dx)+ 


” [. +») SCI, dx) : (4.3) 


\ 
[sl>1 
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â!, x! sont les coordonnées des vecteurs 4 et x, &Y les éléments de la matrice 


de l'opérateur B dans une base orthonormale de R=. 
L'opérateur Z, peut être utilisé au calcul des lois des fonctionnelles 
de type intégrale. Soit 


th 


gun) = [e(s E()—-5G)+x) ds, (4.4) 


où gs, x) est une fonction continue bornce deux fois continüment dérivable 
par rapport à v, de dérivées bornées 


vx) Left, 


Alors v, (7, x} est solution de l'équation intégro-différentielle 
L OX) EL oO NX) Ag, x) v,(, x) — 0 (4.5) 


avec la condition aux limites lin v,(4, x) = 1. 
1 


{ 
Si l’on connaît la fonction v,(#, x), alors 
fh 
E exp £ f g(s, À (s)) a] = Vo, 0). 
le 


16.4.2. Processus homogènes de dimension un à sauts négatifs, Soit £ (1) 
un processus homogène de dimension un de cumulant 


2" 0 
K(2) = dy: . J (e:--1) IT(dx)+ [ ces 1—izx) IT(4x), 4.6) 
_ — 1 


c'est-à-dire £(1) ne peut présenter que des sauts négatifs. Si + 
1 


+ Î XIT(dx) > 0, alors P {sup £(G)— +} — |. Donc le processus 
— æ ç 
n'est pas borné supérieurement et la quantité 
7,= infft:é() = dl 


est presque sûrement finie. L'absence de sauts positifs implique &(r,) = a. 
La quantité 7, s'appelle temps de premier accès au niveau a (temps de 
premier passage par le niveau a) ; 7, est un temps d'arrêt pour le processus 
£(t) (cf. 14.2.4). Voici quelques propriétés de 7, . 

1) 7, comme fonction de a est un processus homogène à accroissements 
indépendants. Ce processus ne décroit presque sûrement pas. 
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2) Posons 


1 0 
K,(2) = ve+ 2 + J (e'*—1) Z1(dx) + J (e‘’—-1—2x) ]1(dx), (4.7) 
—! 


y(4) = : InEe-4%, 2-0. 


y(2) est l'unique solution de l'équation 
K,(-y0)) — À. 


On remarquera que E e°*" existe pour Re z_- 0. Cette fonction est analy- 
tique et 


Ee’<t0 — etKi Ur 
La fonction y(À) est analytique Re À — Oct 
E c'e _ envi) 
3) Signalons enfin la relation liant les lois du processus £(1) et 7, : 
d 


ds 


[P{r,<s) dy — | ] vd, P{E(s) < »}. 
si 


Si fes, x) = _ P {Ë(s) < x} est la densité de probabilité de Es), alors 
Jr(a, s) = _ P{r,<s} est la densité de probabilité de +, et J,{a, s) = 


= fes, à). 


4) Si l'on connaît la loi de 7,, on peut trouver celle du maximum du 
processus 


P{ sup (1) <u) P{r=T} 


O"I=<T 


16.4.3, Loi du maximum et du minimum d'un processus homogène. Soient 
£ (4) un processus homogène de dimension un, £'(4, x) sa fonction de répar- 
tition. Posons 


O,(G, x) — P{ sup £(s) — *} ; 


0<s 1 


dx) — À fe 4 QG. x) dt ; 


4,0, 2) — Î el" d,q+{, x). 


7m 
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Alors 


4+(, z) = exp f Cie [ (e—1)4,F(4, x) 4 à 


0 0 
Si, d'autre part, 
Q_(, x) — P{ inf 0) < x} 
g_(Q, x) = à f e74Q_(1, x) dit : 
0 
4_(, 2) = f e:d,q_(à, x). 
Alors L 


œ fi 0 
3.0, 2 = exp | fe f ("= 1) d, EG, x) dt. 


0 — 


16.4.4, Loi du temps et de la valeur d’un saut. Introduisons les quantités : 
pour a > 
= infft:ét)=> a); y, = E(r,+0)-a, 


7, est le temps de premier saut au-dessus du niveau a, y, la valeur de ce saut 
si sup (4) <a ; si l’on admet que 7, = +, alors y, n'est pas définie. 
! 


Le 


Posons Af(x) — [ Z7(dy), x > 0, où IT est la mesure figurant dans la 


fonction caractéristique du processus & (#) (cf. formule (3.1)). La transformée 
conjointe de Laplace de r et de ;, est définie par 


Ee-ra-/'}ye _ | — 44, a)— 
LL ‘] k 1 —#f4y - __|11— , » 
-{ J | ] If erM(a+y-u 4 dq_{(à, ) daq40Q, v), 


(q4 @, x) sont définis dans 16.4.3). 
La loi conjointe de r, et de y, s'écrit 


P{r.<t, y,>r) = | MUa+y-u)4,Q,(Gu)t 
0 


Î 


! 


Maiy-2-u)d, | d,Q,U-—s, n) d,Q_(s, 2), 
0 


pe 
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où y > 0. Sia<0,7, = inf {r:E(4) = a], 3, = Er, +0) — 4, alors la trans- 
formée conjointe de Laplace de 7, et de y, est définie par 


Ee-Arethÿe = q_(À, a)- 


of 0 
” : | J | Ï eoN(aty--u-v) 7 dy, Q@, ul dg (2, v), 
A CRE 


où N(:) -- (| Hd:) pour z = 0, 


La loi conjointe de ces quantités s'écrit : 


P{r<tp<pr)e fNG@tr-04,Q.(@tu)t 


LS t 
f Nat» --2-—1) d, | d,Q_(t--s, u) d,Q_(s, 2), 
n 


—, © 


où }' —< 0. 


16.4,5, Loi conjointe du suprémum, de l’infimum et de la valeur du processus. 
Pour a < 0 < b,]a, B[ Ja, b[, posons 


QU; a,b;ap)- P { inf É(s) = 4, supé(s) <= b, È(G)E (a. 8)} ; 
s=it s T1! 
(x, dt, dy) de P{r, € di, dr € dy}, 
celte mesure par rapport à dy est concentrée sur [0, <] pour x = 0, et sur 


]- «+, O[ pour x < 0. 
Considérons les transformées de Laplace par rapport à # des fonctions : 


LA (x, À) -- (| e4l'(x, dt, À) ; 


q( ; ah; a, fR) — (| Q(;a,b;a,Pje”h di. 
LG] 


Soit par ailleurs 
04) = fe MP{ÈG)E A} dr. 


3K0) 


On remarquera que la fonction 1" (x, 4) peut être déterminée à l'aide des 
résultats du numéro précédent. Pour x = 0, 


TD (x,(G, c)) = + Î Mx+y-u-—v) dg_(à, 1) dq, Q, v) ; 
pour x = 0, 
0 :». 


LD (x, Ce, 7)) = , Î | NX vu 0) ds (A 10) d Q, v). 
Posons : 
pour x € (b, ] 
GA (x, À) — f L'O(a-b-x, dy)l'O(b-a--v, A_,), 
où 4_,= {v:\+bh€ A); 
pour x € ]-— co, 4] 
G' (x, À) — [| l'O (b-a-x, dv) l'P(a-—-b-7y, 43), 
où À 4e . A je] ; 
et enfin pour «a < x < b 
GA (x, À) — 0. 
Soit par ailleurs 
H® (y, x, A) = at 2 pt Î + (| GP (x, dx)... GP (x, A). 
| 


Alors 
a; a,b;a,f) = ra(Q@, B)— [ [ 2" (a, dy) 119, dy))x 
XH (1, y, dx)r,(@-x, B—x)) 1 
+f (| I] (10, dy) H® (1, y, dz)l'(a-b—z, dx) + 
+1'4(a, dy) HD (1, y, dz)1"® (b—-a-z, dx)}r,(@-—x, PB -x)). 


Considérons également la loi conjointe de la valeur du processus et de 
son suprémum. Si 0 < x = a, alors 


P {sur E(s)-:a, (Gt) = x} _ 


& © 
= PE) < x) ff L'@, ds, dy) P{EG 9 = x ay); 
0 


s 
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si 0 < a < x, alors 

P {su 6( <a, é()= x} = Q+(4, a). 
16.4.6. Loi du suprémum d’un processus sur un intervalle infini. Supposons 
que J _ P{Ë(:) > 0} dt < ©, donc (cf. n° 3.3 et 3.4) que P {su (1) < oo À . 


Alors 
Je" dx P {su E(t) < x} = CXP f + f (e“*—1)d,F(,x)dt\, 


où F4, x) = P{E (1) < x). 
Etudions le cas où le cumulant du processus est de la forme (4.6), 
c'est-à-dire le processus est à sauts négatifs. On a alors 


P {sup E(4) < x} = |—-e"Ër, 
! 


où k est la racine positive de l'équation K,(k) = 0, K', (2) étant définie par 
(4.7). 


16.5. Processus de Poisson 


16.5.1. Définition d’un processus homogène de Poisson. On dit qu'un 
processus homogène à accroissements indépendants £ (1) est un processus 
homogène de Poisson si £(1) admet une loi de Poisson. Il existe alors un 
a > 0 tel que pour tous les k > 0 

F . (ah}° 
P{ÈGH) = k}= P{ÉG+M-ÉG) = k}= 
La fonction caractéristique du processus de Poisson est de la forme 

pe, z) = Ee"*® = exp {ar[e—1]}. 


Voici encore un cas de description des événements par le processus de 
Poisson. 

Supposons que dans une expérience on observe les apparitions de certains 
événements. Si : 1) le nombre d'événements apparus dans l'intervalle [t, 1 + 1h] 
ne dépend ni du nombre ni de la date d'apparitions des événements dans 
(0, #] ; 2) /a probabilité qu'un événement apparaisse sur l'intervalle {r, 1 +h] 
est ah+o(h) ; 3) la probabilité que sur l'intervalle {t,t+h] se réalise plus 
d'un événement est égale à o{h}), alors E(t), le nombre d'événements apparus 
sur l'intervalle (0, t], est un processus de Poisson comme fonction de t. 


e: (5.1) 
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Tout processus homogène en escalier à accroissements indépendants 
dont les sauts sont égaux à 1 est un processus de Poisson. 


16.5.2. Quelques propriétés du processus de Poisson. Voici quelques pro- 
priétés du processus &,(1) = y1+£(1), où £ (1) est un processus de Poisson 


dont les lois sont données par (5.1). 
I. Si y +4 = 0, alors 


P {sup ë,() — +} _ P {inf 5,6) Fe — m} se 
si y + a < 0, alors 

P {sup SU) < 1 œ = P {inf £,(0) — — mo LS 
si y+4a = 0, alors 

P {sup 84) 1e} — P {inf 8-0} - 1. 

II. Si y < 0, y + «a > 0, alors pour x < 0 
P {int DOS Er (5.2) 

où £ est une racine positive de l'équation 


a(e7{—1)-k; = 0. (5.3) 
HI. Si y < 0, y + 4 < 0, alors pour x — 0 


P {sup SU) — x} ss 1- (1 4 NE 


(2) ._ LAE D: g (r 4) 

X Le, ; (*) er, (5.4) 
&=o K'! )’ 

où {x] est la partie entière de x. 


IV. Supposons que c < 0 = d. Si p(c, d) est la probabilité que le pro- 
cessus &,(1) atteigne le niveau c avant d'accéder à l'intervalle ]d, [, alors 


pour y < 0 
{d) 
(, | . cry 
PC, À) = — | (5.5) 


els e) «a k ” | 


CO 
où [x] est la partie entière de x. 
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16.5.3, Processus de Poisson non homogène. C’est un processus & (1) sto- 
chastiquement continu à accroissements indépendants dont les accroisse- 
ments £(1+4)—£Ë(:) admettent une loi de Poisson. Pour un tel processus il 
existe une fonction a(#) non décroissante telle que 


_ Let + Det Dh AUTO ECTU 


Le processus de Poisson décrit le nombre d'apparitions de certains évé- 
nements aléatoires si sont réalisées les conditions : 1) un nombre fini d'évé- 
nements a lieu presque sûrement dans chaque intervalle fini ; 2) les nombres 
d’apparitions des événements sur des intervalles disjoints sont indépendants; 
3) la probabilité d'apparition d'au moins un événement sur un intervalle 
tend vers 0 si la longueur de cet intervalle tend vers 0 ; 4) la probabilité 
d'apparition simultanée de deux événements et plus est nulle. Si ces condi- 
tions sont remplies et si £(r) est le nombre d'événements apparus sur {, #], 
alors £(r) est un processus de Poisson. 

Si la fonction a(r) de la formule (5.6) est strictement monotone, le 
processus peut être rendu homogène par une transformation simple. 
Supposons que &(r) est défini sur [f,, ©] et a(f,) = 0. Désignons par À(r) la 
fonction inverse de a(r) : a((r)) = 1. La fonction (1) est définie sur l'inter- 
valle [0, +00) [. Si &,() = #(2(G)), alors pour 0 & 1 < 1+h < & +00) 


P{E(G+h)—E,0) = k} = P{E(GAG+h))-E(20)) = k} = 


_ AR Os exp {- [a(ac+ h))—a(2())]} : _ e”À, 


P{Ë(G+h)—-E(4) = k} (5.6) 


Donc, ë,(1) est un processus de Poisson homogène de paramètre 1. 
Cette transformation permet de passer d'un processus de Poisson général à 
un processus homogène. 


16.6, Processus wienérien 


16.6.1. Définition et quelques propriétés. On appelle processus wienérien 
dans R° un processus homogène à accroissements indépendants pour lequel 
£(r) admet une loi normale de densité 


P (x) = Qnt) ? exp [- sa (6.1) 


Ce processus est dit également processus wienérien de dimension m. Sa 
fonction caractéristique est 


t(s.s) 


P(2) = Eexp {i(z EU))}=e ©. (6.2) 


Voici quelques propriétés du processus wienérien à plusieurs dimensions. 
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!, Un processus wienérien séparable est presque sûrement continu. 
IT. Loi locale du Ingarithme itéré,. 


he", = pJiim 0; =". 
ue 4/21 In In 1/1 jo 4/21 In in i/r 


HT. Loi du logarithme itéré. 


— £(t) : ë() 
Pin —— = 18 = P{hin —————— ——1\,— 1], 
un V2 int | [um VAlnint | 
IV. Si l'espace est de dimension m > 3, alors 


P{ lim 5) = +} = |, 


— + © 


et de plus, pour tous les À > 1 
m1? 


Te t-7T 


V.SizER“et|z|= 1, alors le processus (z, £(r)) = £,(1) est un pro- 
cessus wienérien de dimension un. Soit par ailleurs {e,, ..., e.,} une base 
orthonormée dans R*. Les processus £..(1), ..., £.. (1) sont des processus 
wienériens indépendants de dimension un. 

VI. Si a€ R", Cest un opérateur linéaire dans R‘' et £ (1) un processus 
wienérien de dimension m, alors 


ë,4)—ta+CEi(r) (6.3) 


est un processus gaussien homogène à accroissements indépendants de 
fonction caractéristique 


! 
EC CET) ES ee, d (6.4) 


où B = CC*(C* est l'opérateur adjoint de C). Tout processus homogène 
gaussien à accroissements indépendants (sa fonction caractéristique est 
nécessairement de la forme (6.4)) se représente par (6.3) ; pour C on peut 
prendre l'opérateur B'/? (la racine carrée positive d'un opérateur non néga- 
tif). Donc, pour tout processus homogène gaussien à accroissements indé- 
pendants &, (1), il existe des vecteurs a, e,, e+, ..., e., des processus wiené- 
riens homogènes indépendants w,(1),..., w,(t) et des nombres f,,... 
... Bn tels que 


BG) = 1a+ À Pme. (6.5) 


Pour vecteurs e, on peut prendre les vecteurs propres B, = 4/(Be,, «) de 
l'opérateur B, 
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16.6.2. Méthode des équations différentielles. Soit £(1) un processus wiené- 
rien de dimension 1. Désignons par 4 l'opérateur de Laplace dans R" : 


“ du 
MS 24 (0x)? ? 
où x!,...,x" sont les coordonnées de x dans une base orthonormée de R*. 


I. La fonction Ef(x +Ë(+)) = u(r, x), où f est une fonction continue 
bornée, est solution de l'équation 
Ou(t, x) 1 
x | e : 
à 3‘ u(t, X) 


avec la condition initiale 
lim ut, x) = f(x). 
140 


IT. Soit g(x) une fonction continue bornée. Alors 


E/(x+4&(1)) exp ets +£(s)) a] = U(4, x) 
0 


est solution de l'équation 


2Q 2 _ + Av(t, x) +8) ve, x), 


avec la condition initiale 
lim u(r, x) = f(x). 
140 


Remarque. Les propositions I et II subsistent si au lieu d'exiger que 
j et g soient bornées, on exige que 
im CEE 0: 
|zl co . 


HIT. Soient G € R" un domaine connexe de frontière lisse 1°, +, le temps 
de premier accès de la frontière T' par le processus x +£Ë(1)(x € G) : 


7,=inf{t:x+é()éG]. 


T, peut prendre la valeur + ©. Si par ailleurs g(x) est une fonction continue 
quelconque, définie sur T”, alors 
a) /a fonction 


u(x) = Ep(x +£ (CA) «ce) 


(Xtr, co) = 1 si T7, <ce et à 0 si Tr = +) est solution de l'équation 


différentielle 
Au(x) = 0 
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avec la condition aux limites 
u(x)= qON) pour _xE 


c'est-à-dire u(x) est une fonction harmonique dans [de valeur frontière 
donnée ; 
b) /a fonction 


u(x) — E gx 1 is) ds, 
0 


où g(x) est une fonction continue bornée dans G, est solution de l'équation 


différentielle 
Av(x) = —2g(x), 


avec la condition aux limites 
v(v)—0, vel: 


C) da fonction 


W(x) = Ep(x-+£(r,)) exp f g(x + (5) 4) 
0 


est solution de l'équation différentielle 
> A) t#(x)w(x) = 0 


avec la condition aux limites 
Ww(x)= gx), xel'; 
d) la fonction 


t 
u (1, X) = E/(x LÈ(r )) exp Lee [ (s)) al Ur, 1)? 
0 


où PT ou l pour T,>t et ER a O0 pour T,<t est solution de 
l'équation 
Ou(t, x) | 


 - Au(t, x) +ge(u(, x), x EG ; 


avec la condition aux limites 
u(O, x) = SX), xEG, u(G,x) = 0, 
xE, 1=>0. 


Les fonctions / et g sont continues dans l’adhérence de G ; si G est 
indéfinie, elles doivent satisfaire la condition formulée dans la remarque. 
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16.6.3. Processus wienérien homogène. Considérons les lois de fonctionnelles 
d'un processus wienérien w(r) de dimension un. 
I. Loi du maximum. Pour x > 0 


C2] 
2 
PJ sup w(s) <= x\ = ee" du; 
{su SL } 7] 
6 


P{ sup H{s) > x} = 2P{w()> x}. 


0csEt 


II. Loi du temps de première traversée. Six > Oetr, = inf{t :w(r) > x], 
la densité de probabilité de +, est (s > 0) 


III. Loi conjointe du maximum et de la valeur du processus. Pour 
x<a a>0 


P{ SUP Hs) < a, “(1 < x} = P{wG)<x}-P{w() > 2a-x)} = 


0<s<xt 


ë P{w(G)=<x}-P{w(r) < x—2a) = | | e“1# du. 


V/2x1t 


1V. Loi du maximum du module. 


P{ sup WG < a} = > 


(— 1x [exp _ À ,,_ pa} du. 
Oms<! 2712700 2! 

V. Loi conjointe du maximum du module et de la valeur du processus, 
Pour (ce, d] < [—a, a] 


P{ sup |w(s)l < a, w(r) € [c, d)} = 


oÆs«t 
d 


ÿ Ce fn | tu-24a7 du 
{ 


/27/:=-0c 


VI. Loi conjointe du maximum, du minimum et de la valeur du processus. 
Pour a < 0 < b, ]x, PB < ]a, b(. Alors 


P{ min w(s)>a, max w(s) <b, w() €, AL} = 
CEE 


Os! 
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ph 


= — 2 | DEEE 


— Exp {- ; (x —2a + 2k(b- ox] dx. 
! 


VIT. Désignons par + le temps de première sortie du processus de l'inter- 
valle {a, b], a < 0 <b 


r= mins :w(r) € [a, b]]. 
Alors 


P{wn bts P{w@)- = 2: 


— (1 b—-a«a 
P{r<1t, w(r)=a)- 
2 s ] 
nr. xp Ÿ ——-(x1(24 + 1)(b—a)}\ dx. 
4/21 [£: » | 2! ( | ° 


— 


VIII. Lal de l'arcsinus. Si 


1 pour x=0; 
(x) = 
O pour x <0, 


alors 


P if E(w(s)) ds < = _ arcsin \/= 


16.6.4. Processus wienérien avec déplacement de dimension un. Soient 
£(t) = at+w(t), a un nombre, w (1) un processus wienérien de dimension 
un. Considérons quelques fonctionnelles de ce processus. 
IL Six > 0,7, le temps de premier accès au point x, alors pour a > 0 
Ee-4" = exp{-x(Va+2à -a)}( > 0). 
Si a < 0, alors 


P{r,= too) = P {sup £() < x} = 1e, 
! 
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IE. Sic<0< d,]a, BIC Ie, df et 
Qt; cd; «,B)=P {min E(s)> ec, 
s «Et 


max £(s) < d, E(1) € Je, Bt}, 


aQ;cd;ap). fe-"QG; cd; af) dt, 
0 


alors 
bp 
| a . Ys'+2] | 
(2 : c, d; a, F0 e” ; : dy- 
ù B) 4/ a +2 | 


L ‘sh Va 22 (d-c) 


————m— me ———— 


Se [d 
sh Va +22c à Qi ACECEPTE 


ñ 
L= _sh Va 124 - Le” Va +200) dy |. 
sh 4/47 +22 (d --c) 
HI. Sic<0-<det 
T=inffs:E(4)4 [c, d]] 
est le temps de première sortie de l'intervalle [c, d], alors 


1e 2e4 
P {£(r) ga ec} = pt p-$0à . 


Chapitre 17 
PROCESSUS BRANCHUS 


17.1. Processus branchus à un type de particules 
(temps discret) 


17.1.1, Définition. Les processus branchus décrivent de nombreux phéno- 
mènes récls de reproduction, de mort et de transformation de particules en 
biologie, physique, technique, démographie, etc. 

Définition 1. On dit qu'une chaîne de Markov homogène E(r), 
t = 0,1, 2,...,à valeurs entières non négatives est un processus branchu 
à un seul type de particules ou processus de Galton-Watson si ses proba- 
bilités de passage p,,(4) = P{5(1) =- j/5(0) — à} pendant un intervalle de 
temps / vérifient les conditions 


dop °° 0; 


Pa) » PO PO). Pi, 0). (LD) 
dt .…. tjrs 


Voici la terminologie adoptée. Le modèle décrit par un processus 
branchu est souvent appelé population. La valeur d’un processus branchu 
E(s) à l'instant # est appelée nombre de particules ou d’individus ou encore 
taille de la population de la génération de numéro #. On dit aussi que 
E(r) est le nombre total de descendants des particules £(0) de la génération 
zéro dans la génération de numéro 1. 

La première égalité de (1.1) traduit l'absence d’autogénération de la 
population une fois que toutes les particules ont disparu ou encore l'absence 
d'immigration (arrivée de particules). 

La deuxième égalité de (1.1) qui signifie que p,(1) pour i = 1 est le 
i-uple produit de convolution de la loi p,{(4), j — 0, 1, 2, ..., par elle- 
même, équivaut à l'hypothèse que chacune des à particules initiales évolue 
(meurt, se transforme en de nouvelles particules du même type) indépendam- 
ment des autres. La deuxième égalité de (1.1) s'appelle condition de branche- 
ment. 

On peut décrire un processus branchu en termes de sommation de 
variables aléatoires indépendantes identiquement réparties non négatives 
à valeurs cntières. 

Soient &,, &£ =: 1, 2, ..., des variables aléatoires indépendantes identi- 
quement réparties interprétées comme le nombre de descendants de l’une 
quelconque des particules à un instant de transformation, c'est-à-dire 
Pa: = Pin 1 = 0, 1, 2, ... . Le nombre de particules £(s 1 1) de la 
( Hl)-ième génération s'exprime en fonction du nombre de particules 
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£(r) de la 1-ième génération par 
£ce) 


ès si £é(0)= 1; 


(1.2) 
6, Si (0) = à. 


17.1.2. Exemples. 1. Survie du nom de famille. Le nom de famille ne se 
transmet qu'aux fils. Supposons que chaque individu possède / descendants 
de sexe masculin avec la probabilité p,. Chaque individu engendre une 
première génération qui, à son tour, engendre une seconde, etc. Le nombre 
total de descendants de la r-ième génération est &(r). 

Il est intéressant d'étudier le nombre de descendants de la #-ième 
génération, c'est-à-dire la répartition de é(r), ainsi que la détermination de 
la probabilité d'extinction du nom de famille qg = P{£(1) = O pour un 
t/E(0) — 0}. 

2. Le multiplicateur électronique est un appareil permettant d’amplifier 
un faisceau d'électrons. Sur le chemin des électrons émis par une source 

le nombre £(0) de ces électrons est la génération 0) on place des plaques. 

haque électron en heurtant la première plaque engendre un nombre 
aléatoire de nouveaux électrons (la première génération) qui, à leur tour, 
frappent la plaque suivante. Le processus &(r), nombre d'électrons émis 
par la #-ième plaque, est un processus branchu. 

3. Réaction en chaîne à neutrons. Sous l’action d’un neutron le noyau 
se désagrège en émettant un nombre aléatoire de nouveaux neutrons. 
Chacun de ces neutrons secondaires peut bombarder d’autres noyaux en 
générant un nombre aléatoire de nouveaux neutrons. Si le nombre initial 
de neutrons est égal à 1 (la génération zéro), la première génération est 
une variable aléatoire &(1). La 1-ième génération &(r) est composée d'un 
nombre aléatoire de neutrons engendrés par les £(*—1) neutrons de la 
(— 1)-ième génération. 


17.1.3. Equations pour les fonctions génératrices. Le fait que les valeurs des 
processus branchus sont entières et, en particulier, les égalités (1.1) et 
(1.2) définissant ces processus, rendent l'appareil des fonctions génératrices 
(cf. chapitre 3) essentiel à leur étude. 

Remarque. Pour les processus branchus E(t) on admet généralement, 
ce que, en principe, on fait plus bas, que E(0) = 1, ce qui du reste ne restreint 
pas la généralité, car d'après la définition 1 pour &(0) — 1 on a affaire à 
&(0) DCE évoluant indépendamment, issus de chacune des E(0) particules 
initiales. 

Soient p, = P{E(1) = j/Ë(0) = 1}, pal) = P{EG) = J/ÉCO) = 1} ; 
D(s) = Efs“"/E(0) = 1] et ®,(s) — Efs“"/£(0) = 1), les fonctions géné- 
ratrices de ces lois, c’est-à-dire 


\(s) = > ytos Ds) = Pi(s). (1.3) 
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La fonction ®,(s) s'appelle fonction génératrice du processus branchu 


Et), 1 = 0,1, .... 
Théorème 1. Pour tous 1, + == 0 la fonction génératrice D\(s) est solution 


de l'équation fonctionnelle fondamentale 
D, 4 rs) = D(P,(5)) (1.4) 


avec la condition initiale 
Ds) = 5. (1.5) 


Donc @,(s) cest la 1t-ièmce itération de la fonction génératrice 
D(s) : Pis) = Ps), P,fs) = D(P(s)), Ps) = P(D(s)) = P,(s) (@(s)) = 
— P(P(D(s))), .… et d’une façon générale 


Ds) = D(E(... D((s)) .….)). (1.6) 


Si Ds, sa ..., 51) = Els*” ... si/#(0) = 1] est la fonction 
génératrice conjointe des variables aléatoires £(1), £(2), ..., £(r), alors 


ŒUUSs,, ..., 5) = Ps (s.0(. Si. D(s,)) .… )) 


Supposons que F{s) est la fonction génératrice de la somme 
£(0)+ ... +£(1) du nombre total de particules dans une population 
pendant l'intervalle [0, #}, 1 = 0, 1, ..., ct que F(s) est la fonction 
génératrice de la somme £(0)+Æ£(1)+ ..., c'est-à-dire le nombre total de 
particules dans la population. Alors 


Fias) = sD(F{(5)) ; (9 
F(s) = sD(F(s)). | 

17.1.4. Exemples. 1. Processus de mort. Soient £(0) = 1, p, = P{Ë(1) = 

= 0/£(0) = 1} = 1-—p, p, = P{Ë() = 1/60) = 1} = p,0<p<1,m=0, 

k => 1. Alors ®(s) = 1-p+sp, D(s) = 1—-p'+5sp, d'où prof) = 1—-p', 

Pu@) = P', Put) = 0, k > 1. je 

2. Fonctions génératrices homographiques. Soient np, = ÛtO 


L=@O+S), _bs 


-_— 4-1  _— DL as _ ———— 
Pa = be -1,b, ec = 0, bte < 1. Alors d(s) . pa 
e . . [a 4 +. ps 
La fonction d(s) est une fonction homographique de la forme 0 


Soient »1 = ®"(1) = ne. et 


1, si m<«lÎl 
Pole, Si m>l. 
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Alors 


[, 4 2 . : 
re 
UE [n SEE Si m1 %# | ; 
D 1-[— — | M |s 
10 ni —q 


te Co (US le — 1]s 


ie 7: si m1 — |. 
1 TG De-tcs 


D'où, par exemple, 


L-- 4 : ner 
ER !] si Mk] ; 
ne. 
1+4(4— 1e 
17.1.5, Moments ct classification. Soient £(0) -- 1, vn(s) = EË(4), mt = 
= ml), o(t) = Var E(t), o° = o(1). 
Les expressions suivantes pour (1) ct w(1) sont une conséquence 


immédiate de l'équation fonctionnelle fondamentale (1.4) pour la fonction 
génératrice d’un processus branchu : 


mt) -: mt, LEE | ES De RE (1.8) 


Pio(t) - 
Si sn — |. 


(1.9) 
0°! si m1 = À. 


Définition 2. On dit qu’un processus branchu à un seul type de parti- 
cules est subcritique si #1 — 1 ; critique si #1 =: 1, (1) — O ; supercritique 
sin > |. 

La condition ®’(1) — 0 de la définition 2 traduit la non-singularité, 
c'est-à-dire la non-dégénérescence du processus correspondant. 

Ainsi donc, (1) décroit cxponentiellement pour les processus sub- 
critiques, est constant pour les processus critiques ct croit exponcnticlle- 
ment pour Îles processus supercritiques. 


17.1.6, Propriétés asymptotiques et théorèmes limites, On dit qu'un processus 
branchu &() a dégénéré à l'instant 2, si &(1,) = 0 pour 4, = 0. La quantité 
4 = P{E(+) = O pour un s = 0/£(0) = 1} s'appelle probabilité de dégénéres- 
cence. 

Si q = 1, le processus £(r) est dit dégénérescent. 

Théorème 2. Pour qu'un processus branchu soit dégénérescent, il est 
nécessaire et suffisant qu'il soit subcritique ou critique. 

Théorème 3. La probabilité de dégénérescence q est la plus petite racine 
non négative de l'équation 

(s) = 5. (1.10) 
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La probabilité de dégénérescence q peut ètre déterminée comme l'une 
des limites suivantes : 


lim p,() ; 
t-> 


4 = lim D{). Fe (1.11) 


L--> © 


la convergence étant uniforme en tous les \s\<&r, r < 1, dans le dernier 
cas. 

Le comportement asymptotique des probabilités p,,(1) pour 1 > 
se décrit comme suit. 

Théorème 4. a) Pour un processus subcritique tel que EË(L) In E(D) = ©, 


on a 
mL pote) = € +o(l). (1.12) 
où ' 
ne œw : 1 — ds) 
C —= I H(B,(0)), h(s) — m(=Ss) , (1.13) 


ec — 0 siet seulement si EË(1) In EC) = cs ; 
b) pour un processus critique tel que D'(1) < > 


2 
Pao(t) — lp) (Lt o(1)) ; (1.14) 


C) pour un processus supercritique 
PaoU) - q— d[@"(a}" + o([d'(a)F"), (1.15) 


où O = D'(q) = 1, d'est une constante positive. 

Un processus branchu converge soit vers 0 soit vers l'infini, cette 
convergence étant extrêmement instable en ce sens que si m1 = EË(1) < c, 
alors lim p,,(…) = 0, j = 1,2, ..., ct pour tout n => 1 


te oo 


lin P{E() = n/£(0) := 1} — 1-4. 


+ 


Les limites suivantes 


. Put) . CS sn | » Q 
l Lo) _. Jin PH) = JC) =- 0, OO) = 1} = O,, = À, 
EU OPUS QE: 


(1.16) 


existent pour les processus subcritiques, et les probabilités Q,, Oz, ... 
forment une loi de probabilités, c’est-à-dire que 


S Q, le 
j=1 


Théorème 5. La fonction génératrice Q(s) = Ÿ Qÿs? est solution de 
EX 


l'équation fonctionnelle 
1—Q(dKs)) = m(1 —-Q(s)). (1.17) 


L'espérance mathématique de la loi Q,, Q:, ... est égale à X/c, où © est 
défini à partir de (1.13). 

Pour les processus critiques à moment d'ordre deux fini on a le théo- 
rème limite. 

Théorème 6. Si E(t) est un processus branchu critique de moment 
d'ordre deux fini, alors 


. E(s) : 
lim PE EG it = x/$(r) => 0, E(0) — 1} ee TA 
M PERGAEG = 0, 60) = 17 ” 0) > 0, SO) d 
(1.18) 
Si 1 < ©, le processus 11) = mr "Ë(r) est une martingale, c'est-à-dire 
EX + T)/0)] = où), Tr = 0. 
Soit £(:) un processus supercritique. Le théorème de convergence des 
martingales nous dit que Île processus 1) converge presque sûrement 
vers une variable aléatoire ». 


Théorème 7. La fonction caractéristique g{s) = Ee""! de la variable 
aléatoire limite 1 est solution de l'équation fonctionnelle 


qUus) = 4q({s)), (1.19) 


cette équation admet une solution unique dans la classe des fonctions carac- 
téristiques dont le moment d'ordre 1 est égal à 1. 

Si 0 = u* < , la fonction de répartition A(x) = P{y < x} présente 
unc discontinuité en O0 : P{y = 0} = 4. La fonction de répartition condi- 


tionnelle 
K(x)—q 
l—q 


cst absolument continue cet la variance conditionnelle Var {r/7 :- 0] est 
positive. 


P{n = x/n — 0} = 


17.2. Processus branchus à un seul type 
de particules (temps continu) 


17.2.1. Définitions. Les théories des processus branchus à temps continu 
et à temps discret présentent beaucoup d’analogies. 

Définition 1. On dit qu’une chaine de Markov homogène (rs), 
1€ [0, of, à valeurs entières non négatives est un processus branchu à 
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un seul type de particules si ses probabilités de passage p,(r) = P{E(1) = 
— j/Ë(0) = i} satisfont les conditions : 


op i=0 , 
D pu) = SO POP)... PU) #03 (CD 
Jit +. +hjei 
2) im po() = ôg (2.2) 


Supposons que £(0) = 1 et que les probabilités de passage p,{(r) 
pour # proche de 0, vérifient la condition 
Put) = 1+qgt+oû), qg <0; | 
Put) = gt) +o(r), jé 1. 
Il est évident que q, = 0 pour j # 1 (dans ce cas q, sont appelées densités 


de passage). 
Soient les fonctions génératrices 


(2.3) 


D(s) = 2 puts! = Els#®/#(0) = 1], f() = > qu. 


La fonction f(s) s'appelle fonction infinitésimale ou fonction génératrice 
différentielle du processus branchu. L'évolution du processus branchu à 
temps continu considéré se décrit comme suit. Chaque particule vit pendant 
une durée de temps aléatoire obéissant à la loi exponentielle de paramètre 


À = g,. À l'expiration du temps de vie, clle engendre un nombre 
1 
aléatoire & de particules du même type, de loi 
P&=j})=-%.,  j=0,2,3, 
à 


Un exemple simple de processus branchu à temps continu est le 
processus de mort et de reproduction pour lequel 
%o = À, Ga = , Qi = —(«+h), g = 0, Î = 3, 4, . 
Définition 2. Un processus branchu £(1) est régulier si 
lim ®,(s) = 1. (2.4) 
st1 


Théorème 1. Pour qu'un processus Ë(t) soit régulier, il est nécessaire 


et suffisant que l'intégrale 
1 


du 
10) 


diverge pour tout & > 0. 
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Remarque. Si Ds) est la fonction génératrice d'un processus branchu 
régulier à temps continu, alors, en admettant que K{s) = D\(s) et en effectu- 
ant de calcul sur les instants t = 0, 1,2, ..., on obtient la fonction génératrice 
d'un processus branclui à temps discret. 

Si les conditions (2.3) et (2.4) sont remplies, la fonction génératrice 
Œ{s) du processus branchu vérifie uniformément en |s|< 1 la relation 
asymptotique 

D{s) = s+1/(5) +041), 1 —+ 0. (2.5) 


Le théorème suivant, analogue de l'équation fonctionnelle fondamentale 
pour les processus à temps discret, est une conséquence de (2.5). 

Théorème 2. La fonction génératrice ®{(s) d'un processus branclu à 
temps continu est solution pour |s1 = 1 : 

a) de l'équation différentielle ordinaire (non linéaire) 


dD 
MO) Le JO) (2.6) 
avec la condition initiale 
Ds) = 5 ; (2.7) 
b) de l'équation linéaire aux dérivées partielles 
OP{s) OD{(s) 
TT = f(s) ôs (2.8) 


avec la méme condition initiale (2.7) ; 
c) de l'équation intégrale non linéaire 


! 
Ds) — (AC, ,() GG) (1 GU)), (2.9) 
oO 
où 
Give 1-0", 1:=0 ; 
MAS 0, t<0 
el 


h(s) = SOS)ERS _ | > 5 3. 
—h #1 da 
Dans (2.9) la fonction G(r) est traitée comme la fonction de réparti- 
tion de la durée de vie de la particule, c'est-à-dire le temps écoulé depuis sa 
naissance jusqu’à sa première transformation en 0, 2, 3, ... particules ; 


h(s) est la fonction génératrice des probabilités conditionnelles {-#, 


qi 
1 = 0,2, 3, ..., que la particule se transforme en } particules sachant que 


cette transformation a eu lieu. 

Les équations (2.6), (2.8) et (2.9) admettent pour tout |5| < 1 une 
solution qui est analytique dans le cercle |s| < 1 et dont les coefficients 
du développement en série suivant les puissances de s sont non négatifs. 
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Ces équations admettent une solution unique pour les processus 
réguliers. 


17.2.2. Exemples. 1. Soit /(s) = 4o +541 +5*Qs, C'est-à-dire que 
b 
SG) = as—1)+ (5-1), 


où a = f"(1), b = f”(1). 
L'équation (2.6) est de la forme 


MO 2 a) 11+5- 1245-17. 


La solution de cette équation est 


(1 — 
gp #75) si a#0; 


_ (e“—1)(1-5s)+1 


P{s) = 
1-5 
1 PRES si a=0, 
2. (1 — 5) +1 
d'où, en décomposant ®{(s) en une série suivant les puissances de s, 
QU 
I = — —— si a <0 ; 
___ (ptl — 
53 1) +1 
P10Q) = 
1 
1— : si a—=0, 
LR 
2 
et pour j # 0 
b el L 
A) 


a 
pit) = Ci e-n+1) 2 -1+1 


2 \?/ br \1”1 : 0 
G 1+ :) (555) HS 
2. Soit f(s) = ads—-1)+4(1—5s)tta, 0 < & < 1, À > max (a, 0). Le 
moment d'ordre 2 du processus est infini ct 


1 : (1—e”c —a#([—s)"< de si axO; 
D{s) = _ [= e“si+e s $ 
1—[œis 4(1—5)-<]" Ua si a=0. 
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3. Soit /(s) = /(s—s5stt1), À = 0, k est un entier positif. Ici 
Ds) = sfe—(elt— 1)st] UE, 


4. Soit / (1) == Â[1—s]{1-+In(1-—s)]. Ici 
D{s) = 1-exp{e-#—-1+e-hMIn(l-s))}. 
5. Soit J'(s) = À[1—s5—-(1—5):], où À = 0,0 < « <1I.Ici 
Ds) = I—[l—-e-t-abpe- Aa] 5)l-aJltt- a), 


C'est un exemple de processus non régulier puisque 
lim Ds) = (1 —e7t-au)ia- a) < |. 
s{t1 


17.2.3. Moments et classification. Que les moments Efé(r]f pour le 
processus branchu £(r), £(0) = 1, à temps continu soient finis découle de 
ce que la dérivée d'ordre £ de la fonction /(s) est finie en 1. 

Posons a = f'(1), b = f'’(1), mr) = EË(s), or) = Var £(r). 

En dérivant (2.9) par rapport à s et en faisant s = 1, on obtient les 
équations différentielles suivantes pour »1(1) et ar) : 


d 
F7 m(t) = ant) (2.10) 


avec la condition initiale 1(0) = 1 ; 


LC : ao{0) + (b— a) n°0) à a # 0, 2.11) 

di b Si a=— 

avec la condition initiale u*(0) -= 0. 
D'où mt) = e“! et 
b 

RE 1) ot LES ns 0, 
| C di D. (2.12) 

bt si a=0. 


Définition 3. On dit qu’un processus branchu à temps continu est 
a) subcritique si a < 0 ; b) critique si a = 0, b = 0 ; c) supercritique si 
a > (. 

De (2.10) il résulte en particulier que la moyenne (+?) : 

a) décroit exponenticilement pour les proccssus subcritiques ; 

b) est constante pour les processus critiques ; 

c) croit exponcntiellement pour les processus supercritiques. 


17.2.4. Propriétés asymptotiques et théorèmes limites. Supposons que 
q = P{Ë(f) = 0 pour un # = 0/£(0) = 1} est la probabilité de dégénéres- 
cence du processus £(r). 
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Les conditions pour lesquelles g = 1 pour. cs processus branchus à 
temps continu sont les mêmes que celles pour les processus à temps discret 
(cf. numéro 17.1.6). 


Théorème 3. La probabilité de dégénérescence q est la plus petite racine 
non négative de l'équation 


JS) = 0. (2.13) 


La probabilité de dégénérescence q peut être déterminée comme l'une des 
limites suivantes : 


lim Pit), 
1 —+ > 
Es 2.14 
î lim D{s), [s| s 1, 


{ —+ oo 


la convergence étant uniforme en tous les s, 1s| < r, v < 1, dans le dernier 
cas. 

Le comportement asymptotique des probabilités p,.(1) pour { > © sc 
décrit de la manière suivante. 


Théorème 4. a) Pour les processus subcritiques, 
Pro) = 1—ce“{(1 +o(1)), (2.15) 


au tf(U—- 0) 


si l'intégrale Î —<——© du — In cceonverge. 


uf(—u) 
b) Pour les processus critiques, 
Pot) = + (1 + u(1)). (2.16) 
Les limites 


lin _PyQ = Jim P{É(@) = j/Ë() > 0,80) = 1}=Q,=<1, j> 1, 


t—»00 1—Pio() 5 —+ 
existent pour les processus subcritiques à temps continu. 
Les probabilités Q,, Q:, ... forment une loi de probabilité $° Q,= 1 
J=1 


ct la fonction génératrice Q(s) = > Q,s! est de la forme 
si 


Q(s) = 1—exp da [#5 al (2.17) 
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1 
on au À 1(- cu) 
Si l'intégrale È WA = du = 
0 
génératrice Q(+) admet 1/c pour espérance mathématique. Les lois condi- 
tionnelles 


. —În « converge, la loi de fonction 


P{ ‘() 2 xJE() > 0, E(O) = 1} 
E{EG)/E() -- 0, E(0) - 1] : 


sont justiciables d’un théorème limite, analogue au théorème limite du 
numéro 17.16. 

Soient m1 =: EË(1) < c et (1) =: et), où a =: f'(1). Le processus 
10) est une martingale à temps continu. 

Soit £(t) un processus supercritique. Du théorème dc convergence des 
martingales il résulte que le processus 7}(?) converge presque sûrement pour 
{ — © vers une variable aléatoire 7. 

Théorème 5. La fonction caractéristique q(s) = Ee“” de la variable 
aléatoire limite n est solution de l'équation différentielle (non linéaire) 


16/60) 500) + 1 
ou de l'équation intégrale équivalente 
"7 SG) - au - 1) | 
. u)-a(u -1 
L-q(s) — -isexp | PLONCESS nf 


Pour b = /'’(1) = 0 la fonction de répartition A(x) = P{y < x} présente 
une discontinuité en 0 : q = P{n — 
La fonction de répartition conditionnelle 


K(x)— 4 


P{y =: \/n = 0} = 1; 


est absolument continue et sa dérivée est continuc pour x = 0. 


17.3. Processus branchus à nombre fini de types 
de particules (temps discret) 


17.3.1. Définition. Un processus branchu à mm = 1) types de particules 
décrit une population de particules ou d'individus dans laquelle les parti- 
cules de chaque type peuvent engendrer des descendants de chacun des 
m types indépendamment des autres particules. 

L'espace des phases d’un processus branchu simulant une population 
de mn types de particules est l'ensemble des vecteurs j = (/1, je, ..., Ja) 
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interprétés comme des vecteurs colonnes, où /, sont des entiers non négatifs 
correspondant au nombre de particules de type & ( est le symbole de la 
transposition). 

Soit e, le vecteur colonne dont la i-ème composante est égale à 1 et les 
autres à O. 

Définition 1. On dit qu'une chaine de Markov homogène &(r) = (£,(), 
&,0), ..…, E(r))", 1 = 0, 1, 2, ..., dont les valeurs sont des vecteurs de 
dimension »1, à composantes entières non négatives, cest un processus 
branchu à »7 types de particules si ses probabilités de passage Pi) = 
= P{Ë(r) = J/É(0) = à}, où &(r) =j désigne E,() = j, k = 1,...,m, 
satisfont les conditions 


On 1=0 (0 = (0,..., 0) est le vecteur nul) ; 
PQ) = : , (3.1) 
: LOU IDNO SRE DO CRE 


où DNO)L désigne le i,-uple produit de convolution de PesjQ) par 
elle-même. 

Les processus branchus à »1 types de particules admettent une des- 
cription simple en termes de sommes de variables aléatoires. Soient &, — 
= QE, k,1=1,...,m},r=1,2,..., des matrices aléatoires indépen- 
dantes identiquement réparties d'éléments entiers non négatifs indépen- 
dants. Pour tout r les variables aléatoires ÊX sont interprétées comme le 
nombre de particules de type / engendrées par une particule de type & à 
l'instant de la transformation. Supposons que la loi de la k-ième ligne 
de la matrice 6, est de la forme 


PR = =) = Pa jU) 


Où J = (jy Ja ..., Ja) + On a les relations suivantes : si &,(1+1) est la 
k-ième coordonnée du vecteur &(1+1) = (£,(1+1), (+1), ..., Et +1), 
où é(r) est un processus branchu à m types de particules, alors 


Este) £s(0) Em(4) 
EQ+D = D'OR+ DER + ... + D GE (3.2) 


CES | ri Pl 


En particulier, si 1 = 2 et £(0) = (1, 0)’, c'est-à-dire que la population est 
composée de deux particules de deux types et à l'instant initial on ne dispose 
que d'une seule particule du premier type, alors &(1) = (811, 812)’ (la premiè- 
re génération de particules est constituée de &!! particules du premier type 
et a &12 particules du second type, engendrées par une particule du premier 
type 


tnt tr tu tu , 
&(2) = D CES UP D'ERES er) 
CE | fæi Fm Pl 
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LL] 11 
C deuxième génération est constituée de Y Eu + Y &21 particules du 


si C2 | 


it Lns 
premier type et de D 134 De 822 particules du second type, ce.) 


CE | ri 
17.3.2. Equations pour les fonctions génératrices. Soit s = (s1, 52, ..., 5). 
La fonction génératrice des probabilités de passage Py() d'un processus 
branchu £(+) à 1 types de particules est définie par 
PA,s)= D Pj(pshst ... sim = E[ Et... SÉmO/E(O) = 5], (3.3) 


j=0 


où désigne oe : 

Ya . 2, px 12 

Pour t fixe, la fonction ®,(i, s) est une fonction scalaire des arguments 
vectoriels £ =: (i,, 4, ..., 1), et 5 = (51, Se, ..., 5) Entre ®{(i,s) et 
D\(e,,s),k = 1,...,m,ona la relation 


Di, s) = Il (Des, sl. (3.4) 


Soit Pots) = D, P{E(O) = à} shs$ .. s'# la fonction génératrice de la 
iz0 
loi initiale pti) = P{È(O) := i} ; Ds) = D P{ÈG) = j} sst ... sm la 
æ © 
fonction génératrice des valeurs du processus ë(r) à l'instant # et soit 
Bis) = (Die,,s), Des, s), ..., Den, s))'. (3.5) 


La fonction ®\,(s) s'appelle fonction génératrice vectorielle du processus 
ë(t). On a la relation 


D\{s) = D (D, (s)). (3.6) 


Théorème 1. Les fonctions génératrices P{(s) et ®,(s) sont solutions des 
équations fonctionnelles fondamentales suivantes : 


Dira(s) = PP, (s)) ; (3.7) 

Dists) = BP. (5)). (3.8) 

Soit F(e,, 5) (éventuellement F(e;, 1) = 1) la fonction génératrice du 
nombre total des divers types de particules de toutes les générations, sachant 


que le processus £(1) a débuté par une particule du type à, F(s) = 
= (Fes, 5), ..., Fe, s))’. Alors F(e,, s) = sB(e;, F(s)). 


17.3.3. Moments et classification. Désignons par M{(t) = {m,i(r), 1, j = 
= 1, ...,m)}la matrice des moments d'ordre un mn,,(#) = Efé;(1)/Ë(0) = e,] 
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d'un processus branchu et par B,(r) = {b$1), à, j = 1,..., m} la matrice 
des moments bf(1) = Efë,(r) £(r)/5(0) = e,] d'ordre deux et soient Me, 
ct D, = B,-Me,e;M', où Â1 = M(1), B, = B,(1), respectivement le 
vecteur du nombre moyen de particules ct la matrice des covariances du 
nombre de particules engendrées par unc particule de type k,# = 1. 

De la définition de ®,(s) il résulte 


ODi(e,,s) . 
ae 


J 


.— 0D{es, 5) 
bi) — ir - ds, ds, - +0 mn), 


mt) — LA 
(3.9) 


où st1 veut dire que toutes les composantes du vecteur s tendent, en 
croissant, vers l'unité. 

Les matrices des moments Af(r) ct B,(r) sont solutions des équations 
aux différences 


M4) - MM), MO) 1: 
B(t+1) = MB{OM'+ Ÿ (er, Meb)Di, (3.10) 
1s1 
B,(0) = ejes, 


où (-, :) désigne le produit scalaire, d'où 


M4) = M'; 


LEE 3.11 
Bt) = M'eeiM"t 5 De, M'e)Mi- DM It, ne 
i—0 1-1 


Supposons que tous les moments »1,, de la matrice Mf sont finis ct 
non tous nuls. Vu que my => 0, le théorème classique de Perron-Frobenius 
pour Îles matrices non négatives nous dit que parmi les valeurs propres 
His i= 1,...,m, de la matrice Mil existe une valeur propre non négative 
H= telle que y — Rey, j # 1, appeléc racine perronnienne de Îa 
matrice Af. 

Définition 2. On dit qu’un processus branchu Ë(r) cest indécomposable 
si la multiplicité de la racine perronnienne y« de la matrice Af est égale 
à 1 et décomposable dans le cas contraire. 

Définition 3. On dit qu’un processus branchu &(s) est positif régulier si 
cxiste un instant #, tel que m4(1,) = O pour tous les 5, j= 1, ..., m. 

Un processus positivement régulier est indécomposable. 

Soient £(r) un processus branchu indécomposable, y la racine perron- 
nienne de la matrice M, u et o les vecteurs propres respectivement à droite et 
à gauche de la matrice M, associés à la racine perronnienne y (ces vecteurs 
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possèdent des coordonnées non négatives d’après Ile même théorème de 
Perron-Frobenius) et normés par la condition 


(o, u) -- À vu, = À. 


Définition 4. On dit qu'un processus branchu indécomposable &(r) est : 
a) suberitique si la racine perronnienne x = 1 ; b) critique si la racine 


rronnienne y = | ct b =: Mb Bvuv, = O0; c) supercritique si la 
/ ay uv, 
4, J. £=i 
racine perronnienne y > Î. 
= 


La condition b -- D ubf}v,v, - O assure la non-singularité du 


{,J,kœl 
processus Ë(s), c'est-à-dire les composantes (e,, s) de la fonction génératrice 
vectorielle D(s) ne sont pas toutes linéaires par rapport à 53, 52 ..., 5, €t 
possèdent des termes libres nuls, donc le nombre de particules varie avec 
lc temps. 

On dit qu'un processus branchu est périodique de période d si le 
p.g.d.c. de tous les # tels que m,(r) = 0 est d. Si d = 1, le processus est 
dit non pérlodique. | 

Tout processus positivement régulier est non périodique. 


17.3.4. Propriétés asymptotiques. Soient £(f) un processus apériodique non 
décomposable, # la racine perronnienne de la matrice Af des moments 
d'ordre un, # ct o respectivement les vecteurs propres à droite ct à gauche de 
la matrice A£ associés à la racine perronnicnne y. La matrice M(r1) des 
moments d'ordre un admet la représentation asymptotique suivante 


Me) = péuo'+o(f), 1-7 ©, 


où uv’ = {uv,, à, j =: 1,...,m}, |A] < pe. 

Supposons que g, :- P{Ë(r) = 0 pour un # :- U/$(0) — e,} est la 
probabilité de dégénérescence du processus £() dont la génération zéro est 
constituée d’une seule particule de type i ct que qg = (qu, Qzs ..., mn) CSt 
le vecteur des probabilités de dégénérescence. 

Théorème 2. Si un processus positivement régulier $(t) est subcritique ou 
critique, alors 

de LS & D 


Soient s = (5, ...,5.)et]s| = max sl. On dit que le vecteur s est 
l<isem 
non négatif si tous les s, = 0. 
Théorème 3. Soit E(r) un processus positivement régulier. Le vecteur des 
probabilités de dégénérescence q est la plus petite solution non négative en 
norme | : | de l'équation 


D(s) = s. (3.12) 
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_. Soit gun vecteur non négatif tel que 1g'1 :< 1 et g' Z 1. Les proba- 
bilités de dégénérescence peuvent être déterminées comme l’unc des limites 
suivantes : 

lim P{5() = 0/0) = e;) ; 
t > 


lim ®(e,, qg'), 


[ECES 


d'où il résulte que l'équation (3.12) n'admet que deux solutions dans la 
classe des vecteurs s, |s] = 1, non négatifs : get Z. 

Le comportement asymptotique des probabilités Pe,olt) pour / -> © 
se décrit de la manière suivante. 

Soient £(r) un processus positivement régulier, A£ la matrice des cspé- 
rances mathématiques #1,, = E(£,(1)/&(0) = e,], y la racine perronnienne 
de la matrice M, u :: (u,, ...,n,) et o = (v,, ..., v,) respectivement les 
vecteurs propres à droite et à gauche de la matrice A£ associés à la racine 
perronnicnne y. 

Théorème 4, à) SiE(t) est un processus subcritique, alors 


Pot) = 1— cul + o(1) ; | 


(3.13 
PHÈG) À 0/E(0) = à} — (0, à) [ex (L 1 0(D))], ) 
où c= lim Las Rues 0) 

+ v,/t 
suffit que 


, de plus, pour que O < € < 0, il faut ct il 


E[S,() In ECD/ËO) = ce] < © 


pour tous les à, j = 1,...,m. 
b) SiE(t) est un processus critique, alors 


2v, | 
lent) = |- b (1 + o(D)) , 


| nn Zi 
P{ÈU) € 0/E(0) — à} — ca 


(3.14) 
(Lt e(D), 


m 
où be ÿ ubfv, 
!, J, k=- 1 


17.3.5. Théorèmes limites. Soit E(t) un processus positivement régulier. 


Théorème 5. Si &(t) est un processus subcritique, alors pour 1 > 
les lois conditionnelles 


PÈ() =: JE) 0, ECO) = ii}, i0 
407 


convergent vers la loi limite Q,, j # 0, D Q, = 1 dont la fonction génératrice 
320 
Q(s) = À Qjsh ... sie est solution de l'équation 
J#0 
1—-Q(®(s)) = «(1 —-Q(s)), 


et dont la loi limite ne dépend pas du vecteur des états initiaux i # 0. 
La loi de fonction génératrice Q(s) a des espérances mathématiques 


finies 
lim 220) LM <= 0, 
st1 Ôs; C 


où cest défini dans la relation (3.13). 
Théorème 6. Si £(t) est un processus critique positivement régulier, 


E(0) = e, et Le) = (Er), ….…., C0), où 


ec = ED, 


alors la loi conditionnelle du processus E“%(+t) sachant que & (eN() À 0, 
converge pour f{—c vers la répartition du vecteur aléatoire Ê1 = 
= (1, 1,...,1)’ ne dépendant pas de e,, où & est une variable aléatoire 
scalaire de loi exponentielle 


PL = x}=e"r. 


Théorème 7. Si E(t) est un processus supercritique positivement régulier 
dont les moments b}), à, j, k = 1, ..., m d'ordre 2 sont finis et y est une 
racine perronnienne de la matrice M, alors le vecteur aléatoire n{t) = 7 "'Ë#(t) 
converge en moyenne quadratique pour t © vers un vecteur aléatoire 
limite n et le vecteur n, pour n # 0, est presque sûrement de même sens que 
le vecteur propre à droite u de la matrice M, associé à la racine perronnienne 1, 
c'est-à-dire n = Lu, où £ est une variable aléatoire scalaire. 


Si b = D ubvv, > 0, alors q = P{n = 0/É(0) = «}. 
#4, J,E 


La fonction caractéristique (conditionnelle) g{e,, s) = Elfe“ (0) = e;] 
du vecteur aléatoire n est solution des équations fonctionnelles 


qe, ts) = Des, q(s)), 
où gs) = (ge, 5), ges, 5), ..., Fem S)). 
17.4. Processus branchus à nombre fini 
de types de particules (temps continu) 


17.4.1. Définition. On dit qu’une chaîne de Markov homogène &(r) = 
= (4,0), EN, ..…., EXC)", 1 E[0, cof, à valeurs dans un ensemble de 
vecteurs de dimension m de coordonnées entières non négatives est un 
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processus branchu à »17 types de particules si ses probabilités de passage 
D) = P{Ë(r) = j/E(0) = i} satisfont les conditions (3.1) ct la condition 


lim pylt) = y: 
110 


Le processus branchu &(r) d'état initial e,, c'est-à-dire que la génération 
zéro des particules est constituée d'une seule particule de type si, évolue de la 
manière suivante : au bout d'un temps aléatoire 7, la particule de type ÿ se 
transforme en un nombre aléatoire &" de particules du type 7, j = 1,...,m, 
chacune de ces particules vivant indépendamment des autres pendant un 
temps aléatoire r,; et se transformant en un nombre aléatoire &* de parti- 
cules du type k, k = 1,...,met ainsi de suite. 


17.4.2. Equation pour les fonctions génératrices. Supposons que £(0) = e, 
et que les probabilités de passage du processus branchu &(r) vérifient les 
conditions 


Paie) 7 lt. 0) +o(r) ; . 

Pei D =a,trou, ea xj, 1—+0 | 
ÿ dej 7 d A PS | À (4.2) 
j=0 


Ilest clair que Les © 0,e, “j (dans ce cas q,,; s'appelle densité de probabi- 
lité de passage de e, en j ). Soient 


(COTE EEE SE 


S(s) Fe . CS FER feu s)) ; 
Be, s) —— 2 PO si"ss" Ci == E[s5" sewt0 JE(O) 2 e]] : 


PD,(s) = (D,(e,, 5), ..., Dies, s))'. 


La fonction f(s) s'appelle fonction génératrice infinitésimale ou différen- 


tielle (vectorielle). 
La fonction génératrice D (s) est continue en # € [0, [ uniformément en 
s, [sl <1 et lim ®,{(s) = s. Si les conditions (4.1), (4.2) sont remplies 


‘40 
uniformément en s, [s| < 1, on a alors la représentation asymptotique 
®D,(s) = s+1f(s)+o(), 1 —+ 0. (4.3) 


Une conséquence de (4.3) est le théorème suivant fournissant l’analogue de 
l'équation fonctionnelle fondamentale pour les processus à temps continu. 

Théorème 1. La fonction génératrice ®{(s) pour |\s| & 1 est solution 
des systèmes suivants d'équations fonctionnelles : 
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à) de svstème d'équations différentielles ordinaires (non linéaires) 


d® 
OL 80) (4.4) 
avec les conditions initiales 
®,{(s) = 5; (4.5) 
b) le système d'équations (linéaires ) aux dérivées partielles 
ni > fers 5) ou (4.6) 
avec les conditions initiales (4.5) ; 
c) de système d'équations intégrales (non linéaires ) 
t 
Dites s)= [ hf, ,(s))dGG)+4s(1-G;0)), (4.7) 
0 
où 
fe,s)-4, ,5 
h,(s) =: JC ) du i— 1, ...,m; 
4 eies 
ee; 4 - 
Gt) — l—-e 2: - 0, 
0, t—< 0. 


Les solutions de ces équations existent et sont des fonctions analytiques 
en s, Is < 1, mais De, s) cn général ne sont pas nécessairement les 
fonctions génératrices de lois de probabilité, c’est-à-dire que dans le cas 
général on peut tout au plus affirmer que 

lim D,(e,, s) = 1. 

si1 

0/(e € s) 


Si toutes les dérivées 4/7 1,...,m, sont finies en 
05, 


s — 1, alors les systèmes d'équations par admettent une solution 
unique pour |{$| = 1 ct . Die, s):-1,i=1,...,m. 


Dans (4.7), G(:) représente la fonction de répartition de la durée de 
vie d’une particule de type à, h,(s) la fonction génératrice des densités de 
transformation d'une particule de type à. 


17.43. Moments et classification. Soit f(s) = (f(e,,s), J(e:,s), 
., Jens $)) la fonction génératrice différentielle d’un processus branchu 
EG). Posons 
… 0/(e,, s) 4) 0 (eu s) 
LS un 05, a . ôs,ôs, * 


A ay à) 1,...,m), Ci {cf 8j: 1, ..., m), 
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sous réserve que ces limites existent. Soient par ailleurs Af(1) = {mij(r), 
i,j=1,..., m}, où mir) = Efé(r)/60) = e], CG) = (cf), à, j = 
= 1, ...,m}), où cr) = Efé(r) (r)/Ë(0) = e:]—-dym(r). Les matrices 
des moments M{(r) et C,((r)) sont solutions des équations différentielles 


LM) = M(04, M(0) = J; 
’ (4.8) 
+ Ci) = Ye, 4e) CH) + MG) CM), C0) = 0. 
D'où 
M = et, 
CG) = j Mol S (er, MG we) M'(u) du. (4.9) 
u si 


Les éléments non diagonaux de la matrice À sont tous non négatifs 
(plus exactement positifs). De telles matrices sont dites quasi non négatives 
(resp. quasi positives). Les propriétés spectrales de ces matrices sont ana- 
logues à celles des matrices non négatives (resp. positives). Par exemple 
parmi les valeurs propres @,, i =: 1, ..., m1, de la matrice À il existe une 
valeur propre réelle « — CPR telle que « — Rec, ji, appelée racine 
perronnienne de la matrice À. Les vecteurs propres associés à la racine per- 
ronnienne « possèdent des coordonnées non négatives. 

Définition 1. On dit qu’un processus branchu £Ë(1) est indécomposable 
si Ja multiplicité de la racine perronnienne « de la matrice À est égale à 1, 
décomposable dans le cas contraire. 

Définition 2. On dit qu’un processus branchu &(r) est régulier si a, < 0 
pour tous les 7 = 1,...,m. 

Soient £(:) un processus non décomposable, # = (u,, ..., nu)’ ct 
o = (u,,..., v,,) respectivement les vecteurs propres à droite et à gauche 
de la matrice 4, associés à la racine perronnienne «, et normés par la 


condition (#, o) — D uv, = 1. 

Définition 3. Un processus branchu non décomposable é(r) est sub- 
critique si « < 0, critique si « = 0 ; b=: ; 2 ucfvv, = 0 ; supercritique 
si > 0. 

La condition b — > ucfÿv,v, > O assure la non-singularité du 
processus &(s). Ceci signifie Qué le nombre de particules varie avec le temps. 


17.4.4. Propriétés asymptotiques. Soient £(#) un processus branchu non 
décomposable, « la racine perronnienne de la matrice À, u et o respective: 
ment les vecteurs propres à droite et à gauche de la matrice À associés à 
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& et normés par la condition (w, o) = 1. Pour la matrice Af(r) des espérances 
mathématiques on a la représentation asymptotique pour { -+ c 
M(e) = e“'uv’ + o(e“'), 

où go’ = {uv,, i, J = 1, ..., mm}, & < «, o(e“'). 

Supposons que g, est la probabilité de dégénérescence d’un processus 
E(s) tel que Ë(0) — e, et g — (qu Ge, ..., 9%) Ve vecteur des probabilités 
de dégénérescence. 

Théorème 2. Si un processus branchu régulier E(t) est suberitique ou 


critique, alors 
g=1={(l1,.::, D" 


Théorème 3. Soir E(r) un processus non décomposable. Le vecteur g des 
probabilités de dégénérescence est la plus petite solution non négative proche 
de 0 de l'équation 


f(5)=0, s>=0, JIsi=— max 1Îs,i-= 1. 
DSi< mn 


Le comportement asymptotique de p,{f) pour 1 -> se décrit de la 


manière suivante : 
Théorème 4. a) Si un processus non décomposable E(r) est subcritique, 


alors 
e"(l—p.40)) = cut o(0) : 
e72P{6() À 0/50) — À} — (o, ijc+o(1), 


où C0 est une constante qui est non nulle si et seulement si 
ES) In &(r)/Ë(0) = e;] < © pour tous les i, j = 1,...,m. 
b) Si un processus non décomposable E(t) est critique et cf} sont finies, 
alors 
2v, 
Per) = 1 HU + O(P)) : 


ee ê) 


P{Ë() # 0/E(0) — 1} = (1 + o(1)), 


où b = D ucYviv,. 
1 


4, 3,k- 
17.5. Processus branchus markoviens généraux 
17.5.1. Définitions. 1. Le modèle général d’un processus branchu markovien 
tient compte, en plus du nombre de particules de la population simulée, de 


caractéristiques telles que la position de ces particules dans l'espace, leurs 
dimensions, leur masse, leur énergie, leur âge, etc. 
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Il importe de signaler que beaucoup de processus branchus non 
markoviens décrivant le nombre de particules d’une population moyennant 
une information supplémentaire sur les particules du type indiqué plus 
haut peuvent être étudiés dans le cadre des processus branchus markoviens 
généraux. 

Supposons que la population est caractérisée par un nombre de parti- 
cules et par un paramètre aléatoire général », interprété comme la position 
des particules dans un certain espace mesurable (X, M) appelé espace 
des phases des particules. 

Supposons que la génération zéro de la population est constituée 
d’une particule et que sa position dans X (par exemple sa masse ou son 
énergie) est égale à 7... Au bout d'un temps aléatoire 7, la particule se trans- 
forme (se désagrège ou engendre de nouvelles particules en leur transmettant 
son énergie) en un nombre aléatoire € de particules de la première génération 
dont les positions dans X sont respectivement égales à 7,, 7, ..., /E 
où MmEX, k = 1, ..., €, sont des variables aléatoires identiquement 
réparties indépendantes entre elles et de &. Chaque particule de la première 
génération se conduit indépendamment des autres comme une particule 
de la génération zéro et ainsi de suite. L'espace des phases du processus 
branchu simulant le schéma décrit doit visiblement tenir compte aussi bien 
du nombre de particules de la population à un instant quelconque que de 
leur position dans l’espace des phases (X, {). 

Supposons qu'à un certain instant la population est constituée de 
particules et que leurs positions dans À sont respectivement égales à 
Kio Xe cs X,. L'état du processus branchu peut être décrit par l'ensemble 
(Xi Xe -.. X,) dans lequel l’ordre importe peu, ce qui exprime que les 
particules sont indiscernables dans la population. : 

Si Z* est le produit cartésien de n espaces, on désignera par X, 
l'espace déduit à partir de X" en identifiant tous les points x" — 

= (Xi Xe -.., X,) Obtenus par permutation des coordonnées, et par A, 
l'i image de la tribu Y" par cette transformation. 


>upposons que À, désigne un espace constitué d'un seul point 4. 
Posons À = U &, et soit À la plus petite tribu contenant À, et toutes 
ñn=0 


les tribus Ÿ. 

2. On appelle processus branchu markovien général à valeurs dans un 
espace des phases (X, A) un processus markovien homogène (sr), 1€ T 
(T = [0, c[ ou T = 0,1,2,...) à valeurs dans un espace des phases 


( Ÿ) dont les probabilités de passage 
P{x*, À) = P{È(:) € AJE(O) = x"} (are À, AE) 


sont solutions de l'équation de ous : 


Pisx, À) = k J PE(x", dy) P(3*, À), (5.1) 


413 


où Pf"(x*, -) est la restriction de la mesure P,(x*, -) à la tribu ü, et 


1, x"€4; 
Ptx", À) = 4,0) = 0 ps 


PPÂx*, &.) est la probabilité qu'à l'instant # la population soit composée 
très exactement de # particules, sachant qu'à l'instant initial elle en comp- 
tait £ situées aux points x,, ...,v, de &. 


(5.2) 


17.5.2. Exemples. 1. Supposons que X est un ensemble fini et que x € X 
est interprété comme un type de particules. Le processus branchu corres- 
pondant est un processus branchu ordinaire à nombre fini de types de 
particules. 

2. Supposons que X = [0, sf et que x EX représente l'âge d'une 
particule, cet âge variant de telle sorte que 4x = ir. La durée de vie de la 
particule est définie par une fonction de répartition G(x). Chaque particule 
cngendre indépendamment des autres un nombre aléatoire de particules 
d'âge zéro. Les processus branchus dépendant de l’Âge correspondant à ce 
modèle décrivent certaines phases de l'évolution de colonies de bactéries 
ou d’autres organismes. 

3. Modèle unidimensionnel d’un réacteur nucléaire, Supposons que les 
neutrons sont susceptibles de se déplacer dans les deux sens dans un inter- 
valle [a, b] (zone active du réacteur). 

Posons À = [a, b] et soit x € X la position d’un neutron à sa naissance. 
Le neutron né en x se déplace à gauche ou à droite avec une probabilité 
de 1/2. Dans tout intervalle de longueur dx le neutron engendre avec la 
probabilité &« dx un certain nombre de nouveaux neutrons se déplaçant 
chacun indépendamment des autres à gauche ou à droite avec une proba- 
bilité de 1/2. 

Ce modèle est décrit par un processus branchu général et constitue 
avec ses analogues bi- et tridimensionnel la base de la théorie mathématique 
des réacteurs nucléaires. 


17.5.3. Equations pour les fonctionnelles génératrices. Au processus branchu 
Er), 1€ 7, sont liées les normes aléatoires &,,(r, -) et »,(-) sur (&, %), 


à valeurs entières non négatives : &,,(f, 4) étant le nombre de particules 


du processus &(1) se trouvant à l'instant / dans l'ensemble 4 E A, sachant 
qu'à l'instant initial elles étaient n et qu'elles étaient situées au point 


x" EX, ; 7,(4) est le nombre des particules filles dans l’ensemble À EX 
à l'instant de la naissance sachant que la particule mère se trouvait en 
x EX à cet instant. 

Soit s(x), x € X une fonction A-mesurable telle que 


sup {s(x)l = 1 ; 
2€ X 


D (x", s(-)) = E exp (| In sp) ë,.(, 7) (5.3) 
x 
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est la fonctionnelle génératrice de la mesure aléatoire & ,(1, -) : 
h(x, s(-)) = E exp f In s(y) 7,(d »| (5.4) 
R2 


est la fonctionnelle génératrice de la mesure aléatoire »,(-). 
Sixt = (xp Ve, ..., X), 8lOrS 


BA», s0)) = ÎLE Pr a). (5.5) 
&k=1 


Supposons que g{x, 4) est la probabilité qu'une particule qui a commencé 
sa promenade en un point x € X et qui n’a subi aucune transformation 
sur (0, #] se trouve à l'instant # dans l'ensemble À € A ; K,(4, À) est la 
probabilité conditionnelle que la durée de vie de la particule se trouvant à 
l'instant # en x ne soit pas supéricure à # et que le point en lequel cette 
particule se trouve à l'instant de transformation appartienne à À. 

Théorème 1. La fonctionnelle génératrice D{x, s(-))(x — x!) est 
solution des équations fonctionnelles suivantes : 


D, (x, 80) = B(x, D,(-, M ))) : 
D, È (x, G ( +) ds Pi(x, I °, 4: ))) , 


PAx, sC)) — f s0») 4,4, dy) t il K,(du, dy) h(y, CN ER s(-))). 
* 0 


Soit M(1, x", À) = EË,(, 4) le nombre moyen de particules se trouvant 


à l'instant # dans l’ensemble À € A sachant que (0) — x". Ce nombre cst 
solution de l'équation 


MG HT, a", À) — Î MG, y, 4) Mr, x, dy). (5.6) 
* 


Exemple. Soit &(r), 1 € [0, cf un processus branchu dont les parti- 
cules sont immobiles entre les transformations (processus branchu à sauts), 


UN, X) re, gr 0. 


Le paramètre q s'appelle intensité des sauts des particules. 
La fonctionnelle génératrice D{x, s(+)) d'un tel processus est solution 
de l'équation différentielle 


L Dx, s0)) tax, 0) = ax, DC) 0), 
l'espérance mathématique À/(4, x, À) est 
MI, x, À) :- ÿ Se e LO(x, À), 
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où 
1, xvéAÀ; 
0, X A ; 
LO(x, 4) = Mn,(4) ; 
Lx, À) = Î LO(x, dy) Le VC, A). 
x 


LOKx, A4) = 


17.5.4. Probabilité de dégénérescence. Pour tout processus branchu général 
£(r), É(O) = x la probabilité de dégénérescence q{(x) est définie comme l’une 


des limites : 
lim PS9 x, À) ; 
{ — © 


lim (x, 0). 


— 


(x) = 
l 


q{(x) est solution de l'équation fonctionnelle 
an) = (x a). (5.7) 


Si la fonction s,(-) est telle que 0 = s4(x) << 1, x EX satisfait la 
condition (x, s(-)) < s,(X) pour tous les x € X, alors q{x) = sx). 

Soient # = 0,1,2,...,M(x) = EË£,(1,X); B(x) = E£(1, X)- MX) = 

(1, 2) (E,(, à - 1]. 

Théorème 2. 1) Si He M(X) = 1, alors q{(x) = 1. 


2) Si Le MX) = h . su B(N\) -= c, alors “e ax) — 1. 


Chapitre 1x 


‘THÉORÈMES LIMITES 
POUR LES PROCESSUS ALÉATOIRES 


18.1. Convergence faible de mesures 
dans des espaces métriques 


18.1.1. Convergence sur les ensembles de continuité de la mesure limite, 
Soient (©, 8, ep) un espace métrique muni d'une tribu borélienne $ et 
d'une métrique (x, ») ; ED) l'espace de toutes les fonctions réelles con- 
tinues et bornées définies sur 4 et de norme HS I = un (01. 


Définition. On dit qu’une suite de mesures *) rh éfinies sur 3, est 
faiblement convergente vers une mesure y: (et on note y, => ju) Si 


in à f SO) 1x) = [ SG) HG x) (1.1) 


pour tous les f' € ©), 

Vu que les valeurs des intégrales f S(x) H(dx) pour tous les SE ED) 
définissent la mesure y# de façon unique, la convergence faible de y, => ye 
et y, = v entraîne y = v. 

De la définition de la convergence faible des mesures il résulte que la 
convergence stochastique d'éléments aléatoires &, à valeurs dans ‘À vers un 
élément aléatoire & entraine la convergence faible des lois P,, des éléments 
aléatoires &, vers la loi P de l'élément aléatoire limite £. La réciproque 
n'est pas vraie à l'exception du cas où la loi limite P est concentrée en un 
point. 

Appelons : Int À — l’ensemble des points intérieurs de À ; (4] l'adhé- 
rence de l’ensemble À ; 4’ l'ensemble des points frontière de À. 

Lemme, Si y, = y, alors pour tout 4€ Bona 

H(Int 4) = lim y,(4) = lim u,(A) = (A). (1.2) 

L'ensemble À s'appelle ensemble pi continuité de la mesure y si 
(4) = 0. 

Appelons A, la famille de tous les ensembles de continuité de la 


mesure 

Théorème 1. Pour qu'une suite de mesures jt, converge faiblement vers 
une mesure jt, il est nécessaire et suffisant que pour chaque ensemble À de 
continuité de la mesure ju on ait 


lim y#,(4) = (A) pour tous les A CU. (1.3) 


NN — wo 
°) En général, y) x 1. 
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18.1.2. Condition de compacité faible d’une famille de mesures. 

Définition. Un ensemble A1 de mesures définies sur $ est faiblement 
compact si de toute suite de mesures y, de Af on peut extraire une suite 
faiblement convergente. 

Théorème 2. Soit © un espace métrique séparable complet. Pour qu'un 
ensemble M1 de mesures définies sur B soit compact, il est nécessaire et 
suffisant que soient réalisées les deux conditions suivantes : 

a) sup {(Ÿ) = © ; (1.4) 


HE M 
b) pour € = 0, il existe un compact K, tel que 
sup u(D\K) = €. (1.5) 
HE M 


Remarque. La complétude de l’espace ‘© n'est utilisée que pour 
prouver la nécessité des conditions a) et b) du théorème 2. 

Pour prouver la convergence faible de la suite des mesures, on établit 
la compacité faible de cette suite puis l’unicité de la mesure limite. 

Corollaire. Si une suite de mesures y, définies sur 5, tribu des boréliens 
de l’espace métrique séparable complet &, est telle que pour tous les 
f € ED) existe la limite 


LS) = lim [70 4, (dx), (1.6) 


il existe alors une mesure y telle que 
LS) = [ JG) ax), 


c'est-à-dire la suite de mesures y, converge faiblement vers y. 


18.1.3. Conditions de convergence faible d’une suite de mesures. Une suite 
de fonctions /, € &(b) converge faiblement vers f si les fonctions /, sont 
bornées dans leur ensemble et lim (x) = f(x) pour tous les x €‘. 


Un ensemble de fonctions F & T(@) s'appelle faiblement fermé si 
la limite de toute suite faiblement convergente de fonctions de F appartient 


Théorème 3. Pour qu'une suite de mesures jt, converge faiblement vers 
une mesure j1, il est nécessaire et suffisant qu'elle soit faiblement compacte 
et que pour un ensemble de fonctions F, € ED) dont l'adhérence faible est 
confondue avec ED) tout entier, on ait 


lim Î SR) 4, (dx) = I] f(x) (dx) pour tous les JE Fo. (1.7) 


Dans la démonstration des théorèmes limites pour les processus 
aléatoires il est commode d'utiliser les conditions de convergence de lois 


particulières. | 
Théorème 4. Soit A, une classe d'ensembles ouverts dans Ÿ contenant 
deux ensembles quelconques avec leur somme et leur intersection et vérifiant 
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les conditions suivantes : 1) la c-adhérence de VW, contient tous les en- 
sembles ouverts : 2) tous les ensembles de X, sont ensembles de continuité 
d'une mesure donnée yt. 

Si pour une suite faiblement compacte de mesures y, on a 


lim (4) = (A) pour tous les A EX, (1.8) 


n — 


alors 11, converge faiblement vers 4e. 

Remarque. Dans les espaces fonctionnels, pour classe %, on envisage 
généralement la classe de tous les ensembles cylindriques ouverts de con- 
tinuité de la mesure limite, donc on peut se servir des conditions de con- 
vergence des lois finidimensionnelles. La convergence faible des mesures 
entraîne la convergence des intégrales de certaines fonctions discontinues. 
Ceci étant, on se sert du fait que l’ensemble des points de discontinuité 
d'une fonction B-mesurable est un ensemble 3-mesurable. 

Lemme. Si une suite de mesures jt, converge faiblement vers y, alors 


lim [Ga (dx) = [SG ax) (1.9) 


pour toute fonction f B-mesurable yt-presque partout contimie et bornée. 


18.1.4. Convergence des mesures dans des espaces vectoriels normés. Dans 
les espaces vectoriels normés, les conditions de convergence faible des mesu- 
res peuvent être formulées sous forme de conditions de convergence de 
fonctionnelles caractéristiques. 

Soient (, 3) un espace de Banach séparable, L, un espace vectoriel 
de fonctionnelles linéaires sur ‘6, tel que la plus petite tribu par rapport à 
RE sont mesurables toutes les fonctionnelles /€ L soit confondue 
avec #. 

Théorème 5. Pour qu'une suite de mesures p, sur (CD, D) soit faiblement 
convergente vers une mesure jt, il est nécessaire et suffisant qu'elle soit 
faiblement compacte et que 


lim I] eo y (dx) = Î eo u(dx) pour tous les TEL. (1.10) 


nn —+> co 


18.2. Convergence faible de mesures 
dans un espace hilbertien 


18.2.1. Conditions imposées aux fonctionnelles caractéristiques. On désignera 
par <Ÿ un espace hilbertien séparable, par Ÿ la tribu de ses boréliens ‘à, 
T; l'ensemble de tous les opérateurs symétriques non négatifs complète- 
ment continus dans ‘©, S l'ensemble de tous les opérateurs nucléaires dans 
©, S, le sous-ensemble de S constitué de tous les opérateurs dont la trace 
n'est pas supérieure à «. 

Les opérateurs de 7%, nous permettent d’énoncer un critère commode 
de compacité des ensembles de 6. 
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Lemme. Pour tout opérateur À € To l'ensemble {x : |A7\xl < 1} est 
compact. Pour tout compact K C ® il existe un opérateur À € T. tel que 
KC{x: l4"lxi< 1). 

La compacité faible d’une famille de mesures dans un espace hilbertien 
équivaut à la continuité (dans un certain sens) de la famille des fonction- 
nelles caractéristiques de ces mesures. 

Théorème 1. Soient M une famille de mesures finies sur B, x,(z), z € ©, la 
fonctionnelle caractéristique d'une mesure u € M. Pour que l'ensemble M 
soit faiblement compact, il est nécessaire et suffisant que : a) 4n(0) soient bor- 
nées dans leur ensemble pour tous les 1 € M ; b) pour tout e = O on puisse 
exhiber un opérateur B € TQ et pour toute mesure 1 € M un opérateur À ALY 
tels que Re [7,(0) — 4A(2)] < € pour (BA, Bz, 2) « 1. 

Remarque. Il existe un exemple dans lequel il est impossible d'indiquer 
pour une suite de mesures faiblement compacte un opérateur 4 € S (com- 
mun à toutes les mesures) tel que Re [7,(0)— 7,(z)] << 8 pour (4z, z) & 1. 

Dans la condition b) du théorème 1 on construit des opérateurs C,, € S 
représentables sous la forme C, = BA,B, où BE Te, A, € S,. On formule 
plus bas les conditions sous fcsquelles cette représentation est possible. 

Lemme 2. Pour qu'une famille d'opérateurs C,,€S soit représentable 
sous la forme C, = BA,B, où BE Te, A1 ES, il est nécessaire que dans 
chaque base orthonormée {e;} la série 


TrCu= À, (Cie er) 


converge uniformément en y1, et suffisant que cette série converge uniformé- 
ment au moins dans une base. 

Désignons par MN; l'espace hilbertien des opérateurs linéaires de 
Hilbert-Schmidt (pour lesquels Tr 4A* < ©) sur © muni du produit sca- 
laire (4, B) = Tr AB*. 

Lemme 3. Si B€ To, A4 € To, A4, € Si, alors l'ensemble des opérateurs 
BA {st compact dans Rx. Pour tout ensemble d'opérateurs C, compact dans 


Ny, il existe un opérateur BET, tel que B°'CÉB""ES,. 
18.2.2. Conditions de compacité d’une famille d'opérateurs. 11 existe une 
condition de compacité d’une famille de mesures plus efficace qui se formule 
en termes de compacité des opérateurs. 

Théorème 2. Pour qu'une famille M de mesures finies pu sur 8 soit 


faiblement compacte, il est nécessaire et suffisant que : 
a) pour tout £ > 0 existe un C tel que 


{x : Ixl > C}<e pour tous les u EM ; 
b) pour tout C > 0 la famille d'opérateurs 8%, définis par la relation 
I] (2, x}? u(dx) = (B%z, B92), 


xl O0 


soit un ensemble compact dans À. 
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La condition b) est équivalente à la condition b’) suivante : la série 
œ 
ÿ 13e |? 
&=1 


converge uniformément en # pour tout € = 0 dans unc base {e,} de ‘© 
(donc dans toute base). 

Coroliaire 1. Supposons que pour des mesures #1 € existent les 
opérateurs corrélatifs 


CAT Ï (z, N)° (dx) 


et AE NZ. Pour que la famille de mesures soit faiblement compacte, il 
suffit que l'ensemble des opérateurs {4°} soit compact dans >; Si pour 
un € > 0 g{(x : xl = C} = 0 pour tous les y € M, alors la compacité 
de {4%} dans 9, est une condition nécessaire de compacité faible de 
la famille de mesures M. 

Corollaire 2. Supposons que les opérateurs 8, sont définis par 


(,z, 2) — J ue nd). 


Pour que la famille de mesures D soit faiblement compacte, il est nécessaire 
et suffisant que : a) l'ensemble des opérateurs {H!/?} soit compact dans 
M et b) lim sup g{x: 1x1 > C} = 0. 
d Co pr CS} 

Ce corollaire nous permet d'énoncer les conditions de compacité faible 
des mesures. 

‘Théorème 3. Pour qu'une suite de mesures y, converge faiblement vers 
une mesure jt, il est nécessaire et sufisant que : a) l'ensemble des opérateurs 
{8 4} soit compact dans À ; b) les fonctionnelles caractéristiques y (2) — 


j ee a (dx) des mesures pa, convergent vers la fonctionnelle caractéris- 
tique y,{2) de la mesure jt pour tous les 2 Cd. 


18.3. Thévrèmes limites pour les processus 
aléatoires continus 


18.3.1. Conditions générales de convergence des lois de fonctionnelles. On 
étudie des processus aléatoires presque sûrement continus. 

Soit Ty s(0) l'ensemble des fonctions x(#) continues, définies sur 
fa, b] et à valeurs dans un espace métrique séparable complet “à. 

Soit sur l'espace (0) la métrique : 


rx, ») = sup e(xG), 0), (3.1) 
b 


a tx 
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où gx, y) est la distance dans 2. La métrique (3.1) fait de %,., (0) un 
espace métrique séparable complet. 

Désignons par 4. (2) la tribu des boréliens de T4 ,{©). Cette 
La _. confondue avec la plus petite tribu des ensembles cylindriques de 

(D). 

I £(r) un processus aléatoire presque sûrement continu défini pour 
1€ (a, b] et à valeurs dans ‘?>. La mesure probabiliste # correspondant au 
processus aléatoire (sr) est alors concentrée sur l'espace mesurable 
(Te CO), Ba 0)}. Ceci étant, les valeurs de la mesure y sur les 
ensembles cy indriques de %4.,,(-?) sont définies par les lois finidimension- 
nelles du processus £(r). 

Dans les théorèmes limites pour les processus aléatoires, on admet gé- 
néralement la convergence des lois finidimensionnelles, c’est-à-dire la con- 
vergence des mesures y,(A) vers la mesure #(4) pour tous les ensembles cy- 
lindriques À qui sont cnsembles de continuité de la mesure limite y. 

Si la mesure limite x est concentrée sur l’espace des fonctions continues 
Le, (D), alors la classe YA, des ensembles cylindriques ouverts de con- 
tinuité de la mesure y satisfait les conditions du théorème 4 du numéro 18.1. 
Donc, pour prouver la convergence faible des mesures y, vers y, il faut 
établir les conditions de compacité faible des mesures y, n = 0 ; à cet effet il 
suffit d'indiquer la forme générale du compact dans l'espace T, ,(Ÿ) 
(cf. théorème 2, numéro 18.1). 

Soient /, une fonction monotone continue positive définie pour à -— 0 
et telle que 7 ,, = 0, X, un compact dans ‘à. 

Lemme 1. L'ensemble des fonctions K(X,, 4s) vérifiant les conditions : 
a) x) E M, a <t =D; b) ext), X(2)) = da, Lil < 8, VO + 0, est 
compact dans Te (@). | 

Pour tout compact Ko dans Te, ,c0) on peut exhiber un compact X5 
dans © et une fonction 3 positive monotone continue pour à > Cet À,, =: 0, 
tels que Ko € K(X:, An). 

Soient &,(r), n = 0, une suite de processus aléatoires dont les réalisa- 
tions appartiennent presque sûrement à l'espace %,, (4), y, les mesures 
probabilistes associées aux processus &,(1). 

Lemme 2. La convergence faible des mesures pi, = fo Pour n-+ est 
équivalente à la convergence des lois de f(£,(-)) vers la loi de f(E{-)) pour 
toute fonctionnelle f(x) u-presque partout continie 84 ,{Ÿ)-mesurable. 

Les conditions (3.2), (3.3) et (3.4) qui suivent sont des conditions de 
AS compacité des suites des mesures y1, associées aux processus aléatoires 

nt). 

Théorème 1. Supposons que les lois finidimensionnelles des processus 
E (1) convergent vers celles d'un processus E(t). Pour que les lois de f(E,(-)) 
convergent vers celles de f(Ë,{-+)) pour toutes les fonctionnelles f contimies sur 
Te NŸ), il est nécessaire et suffisant que pour tout À > 0 l'on ait 


lim sup à sup e(£,(,), £,(42)) =- à 10), (3.2) 
ô 


80 n  Ûls-u< 
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Remarque 1. Au lieu de la condition (3.2) il suffit que pour tout 
0 


lim lim e| sup o(é,(f:), Ë,(2)) > ) = 0. (3.3) 
0 —0 n — > ln —13l <0 
Remarque 2. Au lieu de la condition (3.2) il suffit d'exiger la condition 
suivante : il existe & -- 0, fi -- O et F7 -- 0, tels que pour tous les s,, 
1.6 [a, blet tous les n 


Efe(E Go), EU))P = H1r,-11tT 8. (3.4) 


Les conditions de convergence des fonctionnelles sont concrétisées 
pour chaque type de processus aléatoires continus. 


18.3.2. Processus à accraissements indépendants. Pour les processus continus 
à accroissements indépendants &, (1), # = 0, définis sur un intervalle [a, b), à 
valeurs dans un espace de Banach ‘À, les conditions de convergence des 
fonctionnelles sont établies compte tenu de la propriété suivante des réali- 
sations : 


n -1 
lim D P{ËG,,)-E()1 > €) = 0, (3.5) 
ô—+0 Eu 
pour tous les 6 > 0: art <t<... <1, = b, = max(n,,-#). 
& 


Théorème 2. Pour que pour toute fonction q{x), continue sur Te (CÜ), 
les lois des variables uléatoires q(£,(-)) convergent vers celle de 4(E(-)), il est 
nécessaire el suffisant que soient remplies les conditions : 

1) les lois marginales de processus Er) convergent vers celles du processus 
Ê ( !) e 
so 0 

2) pour tout # :- 0 

lim lim sup P{IE,(:)—E,(1,)] = €} = 0. (3.6) 


4-00 nm -» ff | <4 
18.3.3. Processus markoviens, Pour les processus markoviens continus 
EU), n >= 0, définis sur un intervalle [a, b], à valeurs dans un espace métrique 
complet ‘?> muni de la métrique » et des probabilités de passage P,(4, x, s, A), 
posons 
a, Gi, e) — sup {PQ x 1e Fe )) 3 x ED, nl h}, G7 
où 1, (x) = Or: ox, y) > €). 
Théorème 3. Supposons que les lois des processus £ (+), n = 1, convergent 
pour n -+ vers celles du processus £(t) et que pour tout 6 > 0 : 
lim supa,(h, 6) — 0 ; 
A -> 0 n 
nm --i (3.8) 
lim ÿ P{o(it t 1) E(1)) Es r} D 0, 


ôÔ—0 1-0 


AT... St D, 0 — max, ti). 
à 
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Alors pour toute fonction ç, continue sur Ti (0), les lois de q{E,(-)) 
convergent vers celle de g{£{-)). 


18.3.4. Processus continus construits d’après des sommes de variables 
aléatoires indépendantes, Soit £,,, &,a +, #2, --- une suite de séries de 


variables aléatoires numériques indépendantes dans chaque série, telles que 
E£,, — 0, Î = RE 


. 3.9 
Var Éi La bu D b,, LE À ) 


Définissons les fonctions aléatoires £,(1) pour #1 € {0, 1] à l'aide des 
relations 


& k 
Su = À Ent Lx a 2 bu , 


{—1 
[Sur Sul ASUFAATNE 
let UE 


(3.10) 
EU) = Sat 


S-:=0, dt, = 0. &, (0 est alors une ligne polygonale aléatoire reliant les 


ne 
points du plan de coordonnées (fn, Su), & = 0,1,...,K,. 

Voici les conditions sous lesquelles les lois marginales des processus &,(/) 
et les lois des fonctionnelles de ces processus convergent vers les lois 
marginales et les lois des fonctionnelles correspondantes d'un processus 
wienérien w{1). 

Théorème 4. Supposons que des variables aléatoires indépendantes &,, de 
fonctions de répartition F,{x) satisfont la condition (3.9) et la condition de 
Lindeberg : 

Eh 
im YO [ xd =0 ver 0. (3.11) 


ATP JS 1 ll —e 


Les lois finidimensionnelles des processus E,(t) définies par la relation 
(3.10) convergent alors vers celles d'un processus wienérien w(r) et les lois de 
S(EQ)) convergent vers celle de f(w{-)) pour toute fonctionnelle f continue 
sur Lo, 1 R). 


£ 
Pour les sommes S, — Ÿ° &, de variables aléatoires £, indépendantes 
CE | 
identiquement réparties telles que E!, = 0 et Jo E, = 1, désignons par 
4 [| 
5 — =; Sa: 
(; V/n ) 
Théorème 5. Pour toute fonctionnelle f définie et continue sur To, 1 KR) 
presque partout pour la mesure n,, associée à un processus wienérien n(f), les 


,() la ligne polygonale aléatoire de sommets 
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lois de S(E,(-)) convergent vers celle de J(w(C)). En particulier, on a les re- 
lations limites suivantes : 


lim à max |S,l < «a vil = r sup [|u(1)| < 4 (3.12) 
0&Æt«i 


A —+ © isk«en 


pour presque tous les a. Pour toute fonction g{x), intégrable — Riemann sur 
tout intervalle fini, on a 


i 
] ] 
lim P{i— —=S,l<a=P t)) dt = 3.13 
. É Ës) 4 Î ro) ; ne 
pour tous les a tels que 


"if g(w(0)) dt = 4 = 0. 


18.4. Théorèmes limites pour les processus ne présentant 
pas de discontinuités de seconde espèce 


18.4.1. Métrique dans un espace de fonctions ne présentant pas de disconti- 
nuités de seconde espèce. Soit Dio, ufÜ) l'ensemble des fonctions x(1), 
définies sur [0, 1], à valeurs dans un espace métrique séparable complet ‘& 
muni d’une métrique p, ct prenant les valeurs limites x(1 + 0) pour 0 « ? < 1 
et x(t — 0) pour 0 << I. 

Les fonctions confondues en tous les points de continuité étant identi- 
tiées, à est naturel de fixer les valeurs des fonctions aux points de discon- 
tinuité : 


X() = x +0),  àx(0) = xC-H 0), A1) = A1 —0). 


La quantité e(x(—0), 1(+)) s'appelle valeur du saut de la fonction (1) 
au point ?. 

Désignons par /{ l'ensemble de toutes les fonctions numériques con- 
tinues monotones croissantes sur [0, 1] et telles que (0) = 0, À(1) = 1, 
c'est-à-dire que À(r) est unc application bijective continue de [0, 1] sur {0, 1]. 

La métrique r,(x, y) dans l'espace D. , (0) est définie par 


rp{x, >) = inf | sup e(xQ), >(40))) + Sup AO]. (4.1) 
AEALO=<I=<1 0Stæ&1 


La métrique r,(x, y) fait de D,, (©) un espace métrique séparable 


complet. 
On définit la forme générale des ensembles compacts dans D, (©) 
cn se servant du critère d'absence de discontinuités de seconde espèce. 
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Définissons pour chaque 1(1) € D , (à) la quantité (C :- 0) : 
(x) = sup {min [e(x(”), x0)), e(xQ), x0°°))] ; 
t-C<t=t1<1"<1+0C,1,1,T"C(0, C]} i- SUP {e(x,(0), x(t)) ; 
0 < 1 - C}+sup {o(xt), x(D) ; 1-C << 1}. (4.2) 


Soient X, un compact dans “Ÿ, À, unc fonction positive monotone 
continue définie pour C = 0 et telle que À,, = 0. 

Théorème 1. L'ensemble des fonctions K,(X, a) vérifiant les condi- 
tionts : 

DxEX,, 0=<t1=< 1]; 

2) “kAx) = de, VC > 0, 
est compact dans Dio, 0). 

Pour tout compact K; dans Div, {7} on peut exhiber un compact Xo € 
et une fonction À positive monotone ct continue pour C > 0, 4,4, = 0, tels 
que Ko C K (Xos do). 


18.4.2. Théorème limite fondamental pour les processus sans discontinuités 
de seconde espèce. 

Théorème 2. Supposons que les lois marginales des processus E (tr), 
O=1<1,n2z 0, dont les réalisations appartiennent presque sûrement à 
Do, 1XŸ), convergent pour n + vers celles d'un processus £{f) sans 
discontiniités de seconde espèce. Une condition nécessaire et suffisante pour 
que pour toute fonctionnelle f définie sur Do, \{CŸ) et continue pour la 
métrique rh les lois de [(Ë,(-)) convergent vers celle de J(E{-)) est 


lim lim PÉ(48,(-))) > €} = 0, Ve = 0. (4.3) 


0-0 


Remarque. Au lieu de la condition (4.3) il suMt d'exiger la réalisation 
de la condition suivante : il existe &« :- 0, ff = Oct 47 > 0 tels que pour tous 
lsO=r, <1, <t3=lettouslesu > 1 


Efo(&,(), 8,02) (0, E3))} 22 HUa— 1) 8. (4.4) 


18.4,3, ‘Théorème limite pour les processus markoviens. Soient &,(1), 
O<t+<n,n > 0, une suite de processus markoviens définis sur [0, 1] dont 
les réalisations appartiennent presque sûrement à l'espace Do, (0), 
P,(, x, s, À) les probabilités de passage du processus &,(r) et F, (x) = (y: 
(x, ») > €} pour € > 0. 

ème 3. Si les luis marginules de processus markoviens £ (+) con- 
vergent pour n — © vers celles de Ë(t) et pour tout £ > 0 


lim lim sup {P,(e, x, 5, Ve(X)) 5 x EU, 0Æ<s-t & h} = 0, (4.5) 


A0 nn —+> 


alors pour toute fonctionnelle [ continue sur Do, \K ©) les lois de f(E,(-)) 
convergent vers celle de f(£{-)). Les processus à accroissements indépendants 
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dans un espace vectoriel normé complet £& sont un cas particulier des 
processus markoviens. Le théorème suivant est une conséquence du 
théorème 3. 

Théorème 4, Soit £ (1), n = 0, une suite de processus à accroissements 
indépendants, définis sur [0, 1], dont les réalisations appartiennent presque 
sûrement à Div, ND). Si les lois marginales du processus E,(t) convergent 
vers celles d'un processus ë,{+) et si pour tout € > 0 


lim Jim sup P{Ié,()-£,(s)| > €} = 0, (4.6) 


A0 n > 00 UE) 


alvrs pour toute fonctionnelle f continue sur Di, ©), les lois de f(E,(-)) 
convergent vers celle de J(E{:)). 

Remarque. Dans les théorèmes 2, 3 et 4 il suffit d'exiger que la fonction- 
nelle f'soit mesurable et y,-presque partout continue, y, étant la mesure 
correspondant au processus limite £.(r). 


Chapitre 19 
ÉQUATIONS DIFFÉRENTIELLES STOCHASTIQUES 


19.1. Processus de diffusion 


19,1.1. Définition. Au n° 15.1 nous avons défini le processus de ditfusion 
homogène à partir de la notion d'opératcur caractéristique. Nous allons 
donner une autre définition valable dans le cas d’un processus de diffu- 
sion non homogène qui n'utilise que la notion de probabilité de passage. 

Soit Ÿ la tribu des boréliens d’un espace cuclidien R” de dimension 
m. Une fonction P(s, x, 1, l'),, 0=s<1=T,\xER", l'E, s'appelle 
probabilité de passage si : 

a) P(s, x, 1, l')est une fonction Ÿ-mesurable en « à s, s, l'fixes ; 

b) P(s, x, 1, l') est une mesure probabiliste sur % à s, x, s fixes (de 
sorte que P(s, x, 1, R") = 1) ; 

c) la relation 


P(s, \;, ls, 1") — (| P(s, N, LR dy) Pr, Y EX 1"), 
PL 


appclée équation de Chapman-Kolmogorov, cest réalisée pour tous Îles 
0O=s<1,<1,x€ R"ctl'ES. 

On dira qu'est donné un processus markovien au sens large à valeurs 
dans R" si est donnée la probabilité de passage P(s, x, ?, 1”). 

Définition 1. Un processus markovien au sens large à valeurs dans 
R" sur un intervalle de temps [0, 7°] s'appelle processus de diffusion si 
sont réalisées les conditions : 

1) pour tous les e = 0,71€ [0, T'Jet x € AT 


lim : Î PU, \,tt.l, dy) — 0; 
CET 


2) existe unc fonction «(s, x) à valeurs dans À” ct un opérateur liné- 
aire symétrique défini non négatif /{s, x) de R7 dans R”, tels que pour 
tous les € — 0, x E R"ct1E (0, 7) 


lim Ÿ O-xP( x, 1441, dy) = «(, x) ; 


dt— 0 lr-2l <e 


lim [ G-x, 0) PQ, x, +0, dy) = (BG, x)0, 0), 


A0 |p_s<e 
quel que soit 0 € R",. (0, y) désigne le produit scalaire dans R*. 
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Il est immédiat de voir que si la condition 1) est satisfaite et si les limites 
existent dans la condition 2) pour un certain & = 0, alors elles existent 
pour tous les € = 0 et ne dépendent pas de &. 

Les processus de diffusion tiennent leur dénomination de ce qu'ils 
décrivent assez bien les phénomènes de diffusion. Si une particule en dif- 
fusion se trouve en x à l'instant s, son mouvement entre l'instant f et l’ins- 
tant /+4t peut être représenté par la somme a(r, x) 4t+ Ô(r, 1+ At, x), 
où dt, x) dt est un déplacement non aléatoire lié au mouvement macros- 
copique du milieu où se déroule la diffusion et Ô(r, + 41, x), un vecteur 
aléatoire lié à l'agitation thermique des molécules. On admet en outre 
que l'espérance mathématique du vecteur Ô(t, 1 + At, x) est nulle et que la 
moyenne du carré de sa projection sur une direction quelconque 0 € R" 
est de la forme : 10172 (b(r, x)9, 0) dr. Le vecteur a(t, x) s'appelle vecteur 
de transfert, l'opérateur b{t, x) opérateur de diffusion. En dimension un, 
ils S appellent respectivement coefficients de transfert et de diffusion. 


19.1.2. Equations de Kolmogorov. Les deux théorèmes suivants montrent 
que les processus de diffusion sont étroitement liés aux équations différen- 
tielles aux dérivées partielles de type parabolique. 

Soit donnée une base dans R". Désignons par as, x) les coordonnées 
du vecteur as, x), par b'/(s, x), les éléments de la matrice b(s, x) dans cette 


Théorème 1. Soient donnés un processus de diffusion pour lequel les 
fonctions ds, x) et b{s, x) sont continues et une fonction f(x) bornée continue 
à valeurs réelles telle que la fonction 


u(s, x) = [P(s, x, 1, dy) SO) 
An 


soit deux fois continiment dérivable par rapport à x. La fonction u(s, x) 
est alors dérivable par rapport à s et vérifie l'équation 
Ma Ou ad Ou 
un 1, mn Pc 
ë& 2 12 AUDE TE TP AOL 
XER", 0<s<t, 


avec la condition initiale 
lim «us, x) = f(x). 
st! 


Cette équation s'appelle équation inverse de Kolmogorov. 

Dans de nombreux cas, la probabilité de passage est de densité 
G{s, x, ?, y) par rapport à la mesure de Lebesgue. Ceci signifie que pour 
tous les0 æ&s<1/,xEeR",TEB 


P(s, x,1, 7) = f GG, X, 1, }) dy. 
r 
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Si la fonction G{(s, x, #, ») cst assez lisse comme Tonction de (7, y), 
clle est alors solution de l'équation directe de Kolmogorov, appelée aussi 
équation de Fokker-Planck. 

Théorème 2. Si pour un processus de diffusion les relations aux limites 
de la définition 1 sont réalisées uniformément en x € R" et si existent les 
dérivées continues 

oG(s, x, 1,7) Ô 


ET ” f at, y) G(s, x, 1, p)), 


_ (6 (4, y) G(s, x, 1, y), 


alors la fonction G(s, x, t, y) est de de l'équation 


OG(s, x, 1, y) : e 
Me #8 br, y) G(s, x, 1, y))— 


= . _ (a'(e, ») GS, x, 1, »)). 


pour tous les (1, »)E(s, T)x R". 

Les théorèmes 1 et 2 montrent que l’on peut se servir de la théorie 
des équations différentielles aux dérivées partielles de type parabolique 
pour construire et étudier les propriétés des processus de diffusion. Ce- 
pendant il existe une autre méthode de construction des processus de dif- 
fusion reposant sur la construction directe des trajectoires de tels processus 
comme solutions d'équations différentielles stochastiques. Considérons 
un processus de diffusion £(r) pour comprendre quelle forme doivent avoir 
ces équations. L'accroissement £(t +11) — (1) de £(r) doit avoir les mêmes 
moments tronqués conditionnels (pour £(r) fixe) du premier et du deuxième 
ordre que le vecteur 


dt, E()) A+ or, EG) (WG +17) 0), 


où l'opérateur u(s, x) cest tel que as, x) = br, x) et w{r) est un processus 
wienérien de dimension #1. Nous pouvons écrire à o(-#r) près l'égalité 
approchée (la coïncidence des lois conditionnelles du premier et du second 
membre) 


EG +de) ir) = at, E(r)) A1 +o(r, EG) (we + 17) — n(0)). 


On conçoit naturellement qu'en passant aux différentielles on obtienne 
l'égalité des lois. L'équation en question doit être de la forme 


dE(s) = at, E()) dt +o(r, E(0)) duo). 


Pour donner un sens à cette équation, mettons-la sous la forme inté- 
grale 


E(t) = (0) + f &s, Ë(s)) ds + Sos, E(s)) dw(s). 
ù 
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Le problème est de donner maintenant un sens à la deuxième intégrale 
du second membre de cette équation. Les intégrales de ce type, appelées 
intégrales stochastiques, sont étudiées au n° 19.2. On remarquera que le 
processus wienérien est presque sûrement à variation indéfinie sur tout 
intervalle, donc cette intégrale ne peut pas être comprise au sens de 
Sticltjes. Exhibons en conclusion les conditions que doit remplir un proces- 
sus pour être de diffusion. 

Pour qu’un processus markovien (au sens large) soit de diffusion, 
il suffit que sa probabilité de passage P(s, x, t, 1”) satisfasse les conditions : 

1) pour un Ô = 0 


Ji _ Î lp—x[°+# Pr, x,t+4t, dy) = 0 xER”", 1E[0,T]; 
«hi —+ 0 - 
Û <a 
2) il existe une fonction vectorielle af, x) € R" et un opérateur b{r, x) 
symétrique défini non négatif de R" dans R”, tels que pour tous les # € (0, T] 
etxe R", l'on ait 
: 1 
lim 


At [ G—x) P(, x, 1+ 41, dy) = à(1, x) ; 
At 0 At : 


: |] 
lim — 
it —+0 it 


[ Gx, 0) û, x, 141, dy) = (6(,290,0), 0€ 
RM 


19.2. Intégralcs stochastiques par rapport à un processus wienérien 


19.2.1. Définition d’une intégrale stochastique par rapport à un processus 
wienérien de dimension un. Définissons d’abord l'intégrale stochastique 


fr (e) dur) 


dans le cas où y{+t) est un processus wienérien de dimension un. Soient 
donnés sur un espace probabilisé (9, %, P) un flot de tribus {%,, ? € [0, T]} 
(c'est-à-dire une famille de tribus telle que D, € Dr, € Ÿ pour fi < {3) 
et un processus wienérien n{(#), # € [0, T] à valeurs dans R!, tel que n{0) = 0, 
w{) est Y,-mesurable pour tout 1 €[0, 7] et les accroissements w(1+5) — 
-- w{r) ne dépendent pas de la tribu %, pour s > 0. 

Appelons H.[0, T] l'espace des fonctions aléatoires / (1) = f(f, w) 
à valeurs dans R!, définies sur [0, T] et telles que la variable aléatoire 
f() est G,-mesurable pour tout # € {[0, T] (on dira alors que le processus 
f() est subordonné au flot de tribus {%,, # € [0, T}]}) et l'intégrale 


r 
PRO 
0 
est presque sûrement finie. 
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Théorème 1. À toute processus {f(t), 1€ [0, T]} de l'espace HA0,T] 
on peut associer une variable aléatoire 1$([), définie sur l'espace (Q, ®) et 
jouissant des propriétés suivantes : 

1) si fy fa € HA0, T] et &,, &«, sont des constantes arbitraires, alors 


af taste) = A9 / 1) + le) ; 
2) si un, 0) cest l'indicateur de l'intervalle [#, 3] ulurs 


EGnra) = (4) (4) 5 


T 
3) si SE HA[0, TJet E [ f*0) dt < ce, alurs 
0 


r 
E/ÿ(/)=0, E(/#(/)) = E [#0 di ; 


4) pour tout f€ HAO, T] et toutes constantes C > Oet N > 0, on a 
r 
P{I/N)I > C} <= r F0) dt > \ ou : 
0 


Définition 1. La variable aléatoire IS(f) s'appelle intégrale stochastique 
de la fonction f(t) par rapport à un processus w'ienérien et se note 


r 
11 = [ SO dut). 
0 


On dira qu'une fonction f'E H.[0, T] est en escalier si existe une 
partition de l'intervalle [0, T] par les points 0=#<t1<... <1, =T, 
telle que f(r) = ft) pour n=<t<ti;n k =0,1,..., n—-1. De toute 
évidence, pour Îles fonctions en escalier 


Tr n-1! 
[JO dut) = DACIQUP EE) 


Si (7,0), 1 € [0, T], n = 1,2, ...} est une suite de fonctions en escalier 
telles que pour tout € > 0 


r 
lim ri 1) —S (0) dt > : = 0, 
h —> 00 0 
où /(r) est une fonction de /7,[0, T]}, alors d’après la condition 4) 


r ? 
Pl [AC wo — | 00 dwt) 
0 0 


r 
> : < ete [IAO-LOE à > es} 
0 
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d'où il s'ensuit que la suite de variables aléatoires 
r 
J SE) dur) 


est fondamentale au sens de la convergence stochastique. La limite de 


cette suite n’est autre que l'intégrale J f() dur). 
SifEe H,[0, T]et Ef Se) dt < ©, il existe une suite de fonctions en 
escalier /,(1) € H.[0, T] telles que 
lim Ef G@)—-SO) 1 dt = 0. 
De la propriété 3) il résulte 


T r 2 r 
| fa f Lo] = E [ 120-20P à 
0 0 0 


Tr 
égalité qui traduit le fait que la suite de variables aléatoires f LA) dut) 


0 
est fondamentale au sens de la convergence en moyenne quadratique, 
donc 


r Tr 
[JG dut) = Lim. Î ZO dut). 
0 n—+0 9 
Si un processus f'E H,[0, T] est presque sûrement continu, alors 


Tr n—1 
FO dut) = lim Z J@)IwU+)-" 0), 
Ô a dt +0 E=0 


où 0 — lo < LE << {, — T, At, = +174. 
19.2.2. Estimations des moments. Pour estimer les moments des intégrales 


stochastiques, on aura besoin du théorème suivant. 
Théorème 2. Si SE H.[0, T] et pour un p > 0 


r pli 
E( fi JO dr) < ©, 


alors 


T P T pl2 
| [ SO dwtr) = AE fi JOUE dt) 
0 0 
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pour p = À, ct 


T P r pla 
E } JU) dur) == B,E([ HO) 
0 0 


pour p :- 0, À, et , étant des constantes ne dépendant que de p. 

Pour p =: 2, il est évident que les deux inégalités deviennent égalités, 
et de plus 4, = B, = 1. 

Signalons encore unc égalité pour les intégrales stochastiques qui 
découle immédiatement de la définition : si /, et /,€ H,[0, T]Jet 


T r 
E [ /}() dt < ©, E [ /3()dt 09, 
0 0 
alors 


r r r 
E [ 0) dut) [ 7,0 dut) = E [ AU) O dr. 
0 0 o 


19.2.3. Intégrale stochastique comme fonction de la limite supérieure. 
Pour SE HA0, TJet0<1/,=<1,< T posons 


U r 
[rod = À rt 10 dut), 
t 0 


où 4,0) est l'indicateur de l'intervalle UT U2]: 
r 


On démontre que si € H.[0, TJetE [ J*()dt < «», alors 
0 
h 
«| f TUTA = 0; 
! 


à ï f() do) | s.] = f E{/ 0/3} dt, 


où0a/) St &T. 
Considérons le processus 


! 
If) = ÊS(s) du(s), 1€ (0, T], 
0 
où f € H,{0, T]. Pour tout # ce processus n'est défini que pour presque 


tous les æ, c'est-à-dire à l’équivalence stochastique près. On admettra que 
parmi tous les processus stochastiquement équivalents on a choisi pour 
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I(S) un processus séparable. On peut alors montrer que le processus 
{Z(S), 1 € (0, T}} est presque sûrement continu et 


T7 
N 
rue, > «| << mel] S'Y{s) ds > xl 
0 


r 
Si fEH40, Tjet E [ Sr) dt < oo, le processus (Z{(/), 3), t € [0, T] 


0 
est une martingale continue de carré intégrable, dont la caractéristique est 
définie par 


[ S{s) du(s) 
© 


(UM = fr) 45. 
0 
De plus, 


Î S(6) dus) 
0 


r 
I 
rue, - | <aefroa: 


E sup 


0O<I<r 


f S{s) du(s) 
0 


2 r 
<AE [ J{s) ds. 
0 


19.2.4. Formule de Ito. Supposons qu’un processus {6(r), 1 € [0, T}} sub- 
ordonné à un flot de tribus {%,, ‘€ [0, T]} se représente pour tous les 
O=<1,<1, <= T sous la forme 

la 


ce) = Î et) de+ Î 00) dut, 


où bE H,[0, T}, et le processus a(t) subordonné au flot de tribus {%,, 
t,€ [0, T]} est tel que 


Tr 
ri Ja(r)| dt < =| = 1. 
0 


On dira alors que le processus 6(#) admet une différentielle stochastique 
sur [0, T]: 
dé(t) = à?) dt + br) dur). 


Il est évident que si &,(r) et &,(r) sont des processus admettant des 
différentielles stochastiques et &, et æ., des constantes arbitraires, alors 
d(a ()+a£$3()) = «1 dé (1) +2 der), 
c'est-à-dire l'opération de différentiation est linéaire. Indiquons maintenant 


les formules de différentiation du produit de deux processus et d’une 
fonction composée. 
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Théorème 3. Si les processus & (0) et Ê.(t) admettent des différentielles 


stochastiques 
dé ie) = «i(t) de + b,(6) dus) ; 
dé(r) = «(1) dt + b,(r) dur), 

alurs le processus & (1) £.(t) admet aussi une différentielle stochastique et 

d(£(e) 620) = 0) dé) +80) dé,() + b,() b,() dt. 
Théorème 4. Si un processus E(t) admet une différentielle stochastique 
dE(t) = at) dt + b(r) du{r), 
et si une fonction J{t, x), 1€[0, T], x € R!, à valeurs réelles est continue 


avec ses dérivées partielles f;'(t, x), ft, x) et St, x), alors le processus 
S(t, EQ)) admet aussi une différentielle stochastique et 


df(t, Et) = [ LL, ED) LS, ECO) à) + 
+2 LE 80) b)| dt 4.f(1, 80) duo). 


Cette formule s'appelle formule de Ito. Supposons maintenant que des 
processus &,(r), £,(), ..., Er) possèdent des différentielles stochastiques 


dé) = ar) dt +. b,(r) dun), Éd 2at, 


SO, Xas c. Xn), LEO, T], x, ..., € R' ct soit une fonction réelle 
continue avec ses dérivées partielles 


1, Lo LEA K, î ET Î, ...., Î. 


Le processus /(1, (4), (4), ..., &(4)) admet aussi une différentielle 
stochastique, ct de plus 


dj'(r, S10), Lo), ..) &(0)) Lis [Y (4, EE), ..s GO) à 
{ 
rt 106 0), 80), ..., ED) a+ 
Ù : LEA 
12,2 fa 8 O0) 80 6] a+ 


i 
+2 LG 80), E0)) BIO dur). 
Cette formule s'appelle aussi formule de Ito. 
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Exemple. Si l'on pose / (x) — 1°, on déduit de la formule de Ito 
la relation 


fs 
] (1) du{s) = ; (w(2))° — . (“())°— _ (2— li), O0 <= l, << la. 
f 
19.2.5. Identités pour les moments. Délinissons les fonctions G,(1, x) = 


== {2He, (ti), 1: 0,xX € R, n=0,1,2,..., où He,(z) sont les 
polynômes d'Hermite : 


He, (:) = (— 1)" exp (5) Le CXP {5}. 


Ecrivons à titre d'exemple les cinq premières fonctions G,(f, x) : 
GUN) - L, GUN = NX, GAIN) = X°—1, 
GA, x) =: AIX, GG, x) =: x — 6x0 31°. 


La formule de Ito entraine le 
Thévorème 5, Si JE FZ.[0, T' et pour un n naturel on a 


r nf3 
E( [0 at) < ©, 
O0 
alors pour tous & et f réels le processus 
! t 
(. (: + f SA) ds, P+ f S(s) dt), | 1E[0,T}, 
0 n 
estune martingale et, en particulier, 
Tr r 
EG, (- : f 1°) ds, Pt Î fs) dut) = G{@, f}). 
0 0 
De ce théorème il s'ensuit (pour # = 1) quesi 
r 1/2 
e(i J4) at) < en, 
0 


Île processus 


(rod, à). rer 
0 


cst une martingale (ne possédant éventuellement pas de moment d'ordre 
deux). Sous cette condition on a notamment 


r 
E Î f{s) dw(s) = 0. 
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De cette proposition on déduit immédiatement la propriété suivante 
du processus wicnérien. 

Si 7 est un temps d'arrêt par rapport au processus wienérien {w{(s), 
t = 0}, alors Eu{r) = 0, pourvu que Er"/? = , Que ceci ne soit pas tou- 
jours le cas le prouve l'exemple de temps d'arrêt r, = inf{r: (1) 1} 
pour lequel w(7,) = 1, donc Eu{r,) = 1. On remarquera que Er! = ©, 
bien que Er!/?-" < pour tout € € ]0, 1/2[. 


19.2.6. Intégrales stochastiques par rapport à un processus wienérien à 
plusieurs dimensions, Soient donnés sur un espace probabilisé un flot de 
tribus {%,, ? € [0, T]} et m1 processus wienériens w'(#), ..., w"(t), indépen- 
dants l’un de l'autre, tels que w#(0) = 0, qu'ils soient tous subordonnés 
au flot de tribus {%,, / € (0, T]} et que les accroissements n*(1+5)—n*(1), 
sæ0,£ = 1, ...,m, ne dépendent pas de la tribu %,. Désignons par 
w{r) le processus wicnérien (w'(r}, w*{r), ..., w”(r)) de dimension m1. 

Soit par ailleurs f(r), 1 € [0, T], un processus aléatoire à valeurs matri- 
ciclles. Désignons par f4(r), i = 1,2,...,/3 j = 1,2,...,m, les éléments 
de la matrice f(f). Supposons que /“ € H.(0, T] pour tous les ÿ et /. Il re- 
vient au même de dire que les processus //(#) sont subordonnés au flot 
de tribu {%,, 1€ [0, T]}ct 


r 
rl à = = |, de L'asis fe PF =ls32 Ot 
0 


Nous conservons la notation /7,[0, T] pour l'ensemble des matrices /(+) 
dont les éléments vérifient les conditions énumérées. Si /'(1) est une /Xm- 
matrice, on désignera par /*(#) sa transposée, c'est-à-dire une #17 X /-matrice 
dont l'élément situé à l'intersection de la i-ème ligne et la /-ième colonne 
est /(t). Pour la trace de la matrice / (1) X/*(t) on a la formule 


! m 
Tr (0) (0) = à 2 (/())°. 


En particulier, si /:. 1, alors f(t) est un vecteur de coordonnées 
(SC), ..., f°(0)). Dans ce cas 


TO) = À CO) = VUE 
Définissons maintenant pour /'€ H.[0, T] l'intégrale stochastique 
f JO dut) 
comme un vecteur aléatoire de coordonnées 


= r 
D Of) dwiE), = 1,2,...,1. 


J=1 0 
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Si/ — 1, on obtient la variable aléatoire scalaire 
m T 
D [AD dwi(r), 
j=1 0 


que l'on désignera aussi par 
r 
[ (0), duu)). 
0 


Se), j = 1,2,...,m, étant les coordonnées du vecteur / (sr). 

Voici quelques propriétés des intégrales stochastiques par rapport à 
un processus wienérien à plusieurs dimensions. 

1) L'intégrale stochastique est une fonction linéaire du processus /(t). 


2) Si JE HAO,TJet E Î Tr(/(@) SN) dt < ©, 
0 
alors 


r 2 r 
Ef /G)d()=0, E = E [ Tr(/( J (0) dt. 


T 
[ JU) dut) 
0 


3) Si / (0) et g(2)sont deux processus matriciels d'ordre / Xm de H,[0, T], 
tcls que 


r 
E [ Tr(/@ 4%) dt = +, 
O0 
alors 
r r r 
e(f JG) dur), Î gr) dut) - E (| Tr (JG) 8°) de. 
0 0 (1) 
En particulier, pour / — 1 


T r r 
el [ CG. dt) [ (et), dxtn)|  E [ (JU, 80) dt, 
0 0 0 


_ Pourvu que soit finie la quantité figurant au second membre. Pour / := g on 
obtient l'égalité 


T 2 T 
e|f GU, dto)] = Ef1/(F dr. 
0 0 
4) La modification séparable du processus 


f J{s) dw(s),  1E[0,T], 
Û 
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cest un processus continu de dimension / pour tout SE H.[0, T]. Si 0 est un 
élément quelconque (non aléatoire) de l’espace R', alors en posant 


«= (0, [rw dw6s), 


on obtient l'inégalité 
P{ sup léeu)l > c}= e all (7@):-J°(09, 0) dr > f 


où Wet C'sont des constantes positives quelconques. 


Si/ = 1, il vient 

: r 

r Sup -e) «Er a =] 
0&I<T C . 


T 
5) Si fCHA0, Jet E f Tr(J() 1°) dt = >, alors le processus 
0 


T 
Î (JG), du(s)) 


Ü 
(1 S{s) dus), Si). 1C[0,7] 
0 


est une martingale de dimension / de carré intégrable. Sa caractéristique, 
qui est un processus matriciel l'ordre /X/, est définie par l'intégrale 


FO SO) ds, 1€(0, TI]. 


Par ailleurs, pour 0 quelconque de R'on a 


T 
P{ sup, lég(r)1 :- c} <= | (74)J*()9, 0) dt ; 


Tr 
E sup lé@)l<4E | (/()/*()6, 0) di, 
0<I<r 0 


où ét) est définie dans la propriété 4). 
En particulier, pour / = 1 la caractéristique de la martingale 


[ (6), dm(s)), 1€ (0, T] 
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est 
j I/(s)lds, 1€[0,7T]. 
6) Si fE H,[0, Tlet pourunp = 0 
eff Tr (SG) JS *()) ‘1 é < ©, 
on a alors 


r 
E| f JG) dut) 
0 


P r CIE 
Fm AE ([ Tr(f@)J*)) at) 
0 
pour p > 1,et 


r 
| [ JO dwt) 


P r pl? 
< BE f Tr(f() s“o}dr) 
0 


pour p > 0, 4, et B, étant des constantes dépendant uniquement de p. 
7) Supposons qu'un processus &(#) de dimension / soit justiciable pour 
tous les 0 <& #, < f, = Tde la représentation 


EU) = Î ets) ds + [ 605) dus) 


où b(r) est un processus matriciel d'ordre /Xm de H,[0, T] et a(r) un proces- 
sus vectoriel dont les coordonnées sont subordonnées au flot de tribus 
{Su 1 € [0, T]} et sont intégrables presque sûrement sur l'intervalle (0, T]. 
On dira alors que le processus &(1) admet une différentielle stochastique 


dé(s) = a+) dt + b{r) dur). 
Si le processus (1) admet la différentielle stochastique indiquée et 


SG, x), 1€ (0, T], x E R!, est une fonction réelle continue avec ses dérivées 
partielles 


AU X), Lait, X), [5 X), il, j + 1, ss l, 


alors le processus f(s, (1), 1 € [0, T], admet aussi une différentielle stochas- 
tique et 


df(, 80) = [re 0) CO PAUGAO))E: 
+ Fr Tr (4) br, «0))] dr+ (Je, 80), b() dur), 
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où J, cst le vecteur de coordonnées /, /!,, ..., f', et f’’ la matrice 
d'éléments fn à j = 1,..., 4. 
La formule indiquée s'appelle aussi formule de Ito. Détaillons-la : 


df(r, &) = PC E(r)) +ÿ aie) fr, EG) + 


L 
DEL OL OA «)) dt 


&,0-1 j'1 


I 
2 
! 
ÿ D 14,50) Ptit) dut). 


4 
CE 


19.3. Equations différentielles stochastiques 
pour les processus continus 


19.3.1. Théorème d'existence ct d’unicité de la solution. Soient donnés : 

1) un espace probabilisé (Q, %, P) et un flot de tribus {%,,1 € [0, T})} : 

2) un processus wienérien n{r) = {m"(1), ..., w“(1)} de dimension "» 
adapté au flot de tribus {%,, € (0, T}} (cela revient à dire que (0) = 0 
pour tous les # € [0, 7], que ur) est %,-mesurable et que les accroissements 
w(1-+5)—w(1) ne dépendent pas des tribus #, pour s == 0) ; 

3) un vecteur aléatoire %.-mesurable £, (on remarquera qu'en vertu 
de 2) la tribu à, donc le vecteur £, ne dépendent pas du processus 
{w(r), 1 € [0, T}}) ; 

4) des fonctions «s, x) et ufr, x), 16 [0, T], x € R® à valeurs dans 
R= et L(R®*) respectivement, où Z(R") est l’ensemble de tous les opérateurs 
linéaires de R° dans R* ;: on admet que «f, x) et u(?, x) sont mesurables 
par rapport à l'ensemble des variables. 

On étudiera l'équation différentielle stochastique 


di) -— ar, EG) dr to(r, 5) dutr) (3.1) 
avec la condition initiale 
{(0) a ne 


Cette équation peut se mettre sous la forme intégrale 
t t 
È() — Et (| as, Es) ds 1 Ï os, Ë(s)) dus), 1€ (0, 7], 
Oo 0 


ë(t) étant le processus cherché. Voici la définition exacte de ce que nous 
entendrons par solution de l'équation (3.1). 

Définition 1. On appelle solution de l'équation (3.1) avec la condition 
initiale E(O) = £ un processus {5(), 1 € (0, T]} de dimension m tel que : 

a) Et) soit R,-mesurables pour tons les t COST] ; 
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b) routes les coordonnées du processus vectoriel {a(t, ë(1)), 1 € [0, T]} 
soient absolument presque sûrement intégrables sur l'intervalle (0, T] ; 

c) tous les éléments du processus matriciel {o(s, E()), 1 € [0, T]} soient 
de carré intégrable presque sûrement sur (0, T] ; 

d) le processus E(t) admette une différentielle stochastique, et de plus 
dË(r) = as, Er) dt + o(r, E(r)) du(r)et (0) = &c. 

On remarquera que si a(s, x) = 0 l'équation (3.1) se transforme en 
une équation différentielle ordinaire, il est vrai avec une condition initiale 
aléatoire. Cette équation peut être résolue par les méthodes classiques pour 
tout «. 

Définition 2. On dit que l'éguation (3.1) admet une solution unique si 
pour deux quelconques de ses solutions £ (+) et £,(t) 


P{ sup 1£()-£1)1 > 0 = 0; 
OZ<IST 


Enonçons le théorème d'existence et d’unicité de la solution de l'équa- 
tion (3.1). 

Théorème 1. Supposons que les coefficients de l'équation (3.1) satisfont 
les conditions : 

A) pour tous les t E {0,T],x € R°,ona 


La(r, x) + lof, x) << KO + 1x1), 


em 
où K est une constante, |o(t, X) — 2 (o#(r, x)}°, of(r, x) étant les 
J,£=1 


éléments de la matrice a(t, X) ; 
B) pour tout R = 0 il existe une constante C} telle que pour |x| = R, 
ll RettE[0, TJona 


Las, x)— as, y) -+1a(r, x) —o(, D) & Crix-yf. 

L'équation (3.1) admet sous ces conditions une solution unique continue 
&(r), 1€ [0, T]. 

Remarque 1. Soient données des fonctions a,(t, x), at, x), à = 1, 2, 
vérifiant les conditions du théorème 1 ; telles que a,(r, x) = a.(1, x) et 
of, x) = 0,1, x) pour un N=-0et |x|i = N, 1€ [(0,T]. Désignons par 
ë(e), i = 1,2, la solution de l'équation 

déj(r) = ar, E(e)) dt +o{r, Er) dw(r) 
vérifiant la même condition initiale £,(0) = £,, à — 1, 2. Posons d'autre 


part 
r=infft: lEGI= N} = 1,2: 


si l'ensemble entre accolades est vide, on conviendra que 7, = T. On montre 
alors que P{r7, = r,} = 1et 


à sup 165) 205) = à = 0. 


0O<s«T; 
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Cette propriété des solutions de l'équation (3.1) caractérise ce qu'on appelle 
la dépendance locale de la solution par rapport aux coefficients de l’équa- 
tion. 

Remarque 2. Dans les conditions du théorème 1 la solution £(r) 
de l'équation (3.1) est mesurable (pour tout ? € [0, T], par rapport à la 
plus petite tribu engendrée par le vecteur aléatoire &, et les valeurs du 
processus n{s) pour s = #. Ceci résulte du fait que l'équation (3.1) peut 
être résolue par la méthode des approximations successives. 

Nous verrons plus loin que l'équation (3.1) possède des solutions 
ne jouissant pas de cette propriété. 

Remarque 3. Si les conditions du théorème 1 sont satisfaites et 
El£l? <:» pour un pentier, alors la solution de l'équation (3.1) vérifiant 
la condition initiale £, satisfait les conditions : 


E EG) < KCLHE TE"), LE L0,T]: 
ES) -Sl" < FU HE lél??)r, 1€ (0, T], 
où K,, K, sont des constantes dépendant uniquement de p, K'et T. 
19.3.2. Solution comme processus de diffusion. Dans les conditions du 
théorème 1, la solution £(r), 1 € (0, T], de l'équation (3.1) jouit de lu pro- 
priété de Markov par rapport au flot de tribus {%,, # € [0, 7]. Ce qui revient 


à dire que pour tous 0 = s = 1 = Tet LC, où $ est la tribu des boréliens 
de R", on a presque sûrement 


P{G) € ITS} — PQ) € DEC). 
Donc, le processus £{(r), # € [0, T] est une fonction aléatoire markovienne 
de loi initiale 
HP CTY J'EN. 
La probabilité de passage P(s, x, ?, 1") de la fonction aléatoire marko- 
vienne (sr), s € (0, Test définie par la formule 
P(s,x,1,1 — PÉLO ETS 0—s=31-2 TS NE R", MEN, 


où &,,(@) est solution de l'équation 
0 t 
ë,0) — x 1 far, Em) dri L'or, &,00 dutn)), (3.2) 


x est un vecteur non aléatoire de R",1€[s, T]. 

Le théorème suivant nous apprend que moyennant certaines conditions 
la solution de l'équation (3.1) est un processus de diffusion. 

Théorème 2. Supposons que des fonctions &(t, x) et ur, x) satisfont les 
conditions du théorème 1 et, de plus, qu'elles sont contimies en l'ensemble des 
variables. Alors le processus (rt), t € (0, T], solution de l'équation (3.1), est 
un processus de diffusion de vecteur de transfert dt, X)et de matrice de diffu- 
sion 4, X) = ot, No, N°. 
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Donc, la théorie des équations différentielles stochastiques nous per- 
met de construire des processus de diffusion moyennant des hypothèses 
assez larges sur les coefficients a(s, x) et br, x). Si, de plus, l’on exige que les 
fonctions as, x) et a(r, x) soient lisses, on peut établir que la fonction 


u(s, x) = E/(é,()), 0<s<1<T, XER”, 


admet deux dérivées continues par rapport à x et obtenir ainsi l'équation 
inverse de Kolmogorov. Plus exactement, on a le 

Théorème 3. Supposons que les fonctions at, x) et ot, x) vérifient les 
conditions du théorème 1, sont continues et deux fois continment dérivables 
par rapport à x. Supposons, d'autre part, que pour un p = O0 et un K => 0 
on ait 


[ax], | 200.2) 
D ra ET " J, De Ovt 
_ d°o(1, x) : 
UE EEE < K(1+-1x|?). 


Si f(x), x E R*, est une fonction deux fois continñment dérivable à 
valeurs réelles, telle que 


Of (1) - 
PCI ES EE 
alors la fonction 
u(s, x) = Ef(£,0)), 0=s<1<T, \CR, 
où E, (0) est solution de l'équation (3.2), est solution de l'équation 
220.29 N) QD 4 $ ds, : 282 x) | 7 > È us, NX 


Ou(s, F L 
Ox! ax! 


0°/(x) 
Ox! dx! 


= K(LEIxIr) (= 0), 


Xo(s, x) 


avec la condition initiale 
Jin us, x) — SN), 
s1! 


s€]0,1(, x ER. 

De ce théorème on déduit le théorème suivant d'existence et d’unicité 
de la solution du problème de Cauchy pour les équations aux dérivées 
partielles de type parabolique. 

Théorème 4. Soit donné pour 0 = s < T, x € R", l'opérateur différen- 


tiel 
Lu, 2) = 6, + À as + DCS D 
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de type parabolique (ceci signifie que pour tous les sE[0,T],xE R“,ona 


D b'(s, x)0'03 > 0, quels que soient les réels U', 8, ..., "TX. Si la matrice 
{, 


=i 
b{t, x) d'éléments b{(r, x), à, j = 1, 2, ..., m, est telle que br, x) = ot, x) X 
X(o(r, x))*, et les fonctions at, x) et or, x) satisfont les conditions du 
théorème 3, alors le problème de Cauchy 


Lu(s, x) = 0; 
lim us, x) = f(x) 
sr 


admet une solution unique pour toute fonction f(x) deux fois continûment 
dérivable croissant avec toutes ses dérivées partielles du premier et du second 
ordre pas plus vite qu'une puissance de |x| pour |x|\ — ©. Ceci étant, la 
solution u(s, x) du problème de Cauchy indiqué peut se mettre sous la forme 


u(s, x) = ES(E,(D)), 0<s<T, xER", 


où £, (1), 1 Es, T], est solution de l'équation (3.2) 

Ce théorème nous apprend que la théorie des équations différentielles 
stochastiques convient parfaitement à l'étude des équations aux dérivées 
partielles. Le fait que la non-dégénérescence de la matrice b{r, x) n'est pas 
postulée dans le théorème confère un avantage indéniable aux méthodes 
relevant de la théorie des équations différentielles stochastiques. 


19.3.3, Equations pour les fonctions caractéristiques des fonctionnelles. 
Soit {£(r), 1 € [0, T]}, la solution de l'équation (3.1). Considérons les fonction- 
nelles 


r T 
I] gs, £(s)) ds, (| Hs, E(s)) du(s), 
Ô Ô 


où g(s, x), sE (0, T], x E R”, est une fonction à valeurs dans R! et /(s, x), 
sE(0,7T], xE R*, une fonction matricielle d'ordre /Xm. Les lois des 
fonctionnelles indiquées seront définies si l’on trouve la fonction 


r 
u(s, x) = E/(£é,(T)) exp { (2 (| g(r, Er) ds) + 


+i(o Î h(r, £,,(r)) auto) 


où0O=s < T,xE R",À,0€ R', (tr) est la solution de l'équation (3.2), 
f(x), x E R°, une fonction réelle. 

On démontre que si les coefficients de l'équation (3.1) et la fonction 
f(x) satisfont les conditions du théorème 3 et si les fonctions g(s, x) et 
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h(r, y) sont deux fois continâment dérivables par rapport à x et, de plus, 
pourunp > Oetun > 0 


Og(, x) - 
À À Eœl a 2, 
m 1, | Oh(t, x 
a LE, ES 


O?h! Oh" (1, x) x) 
ETC 
alors la fonction us, x), O =: 5 < 7, x E R*, est solution de l'équation 
0° u(s, x) 


_ CU, S ÿ ds, Je, x), a bit(s, x) - D où Le 


E=1 


_. 9 


AS 


< K(1L+]x/|?), 


e 2e x) ï [ 
NYLON tol(s, X)— 
+ RE 77 DS ka (s, ND UE pus, x) D tels, X) 
u 
où 
bits, x) = Ÿ al(s, x)ut(s, x), j,k—=1,2,...,m ; 
ri 
cs, x) = D hs, x) Ms, x), FREE RE LE 
ral 
d'(s, x) = ÿ oÏ(s, x) Ps, x), fee 12,58 013 kel 2 sl 
CC | 
A cette équation on peut ajouter la condition initiale 
lin us, x) = / (x). 
stt 


L'équation pour la fonction «(s, x) peut se mettre sous la forme plus 
concise : 


26,2) + (as, 0), MG, NV) + 5 Te (os, x) 05, x) nu, N)) + 
+ (os, x) h°(s, x) 0, us, x)) + us, x) [it gs, N), à) + | hs, x)0 sl = 0, 


: £ Ou . : 
où #, est le vecteur de coordonnées PT kK --1,2,...,m,us, la matrice 


,Kk — 1,...,m. 


: O°u 
d'éléments Ov 0 5 Ji 
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19.3.4, Position du problème en termes de martingales. Dans le théorème 1, 
la condition de Lipschitz est trop stricte. De nombreux problèmes nous 
conduisent à considérer des équations différentielles stochastiques dont les 
coefficients ne satisfont pas cette condition. Il paraît donc plus commode 
d'élargir un peu la notion même de solution d’une équation différentielle 
stochastique, ct notamment on peut considérer que seuls les coefficients de 
l'équation sont donnés. On demande de construire un espace probabilisé 
et de définir sur lui un processus wicnérien w(r) et un processus é(#) qui 
soient reliés entre eux par l'équation (3.1) avec les coefficients donnés. 
I! est entendu que la plus petite tribu, engendrée par les valeurs du proces- 
sus é(s) pour s « ?, et les accroissements #{+7+)—"{1), pour + > 0, 
sont nécessairement indépendants. 

D'autre part, si é(r) est solution de l'équation (3.1) avec la condition 
£o, il est manifeste que le processus 


E()—E0— | a(s, Es) ds 
0 


est une martingale continue de carré intégrable dont la caractéristique est 
{ 


I] b{s, £(s)) ds, 


où b(s, x) = u(s, x)u*(s, x). Inversement, si le processus &(r) possède ces 
propriétés, alors, en étendant (au besoin) l’espace probabilisé, on peut 
AUS un processus wienérien w(1) qui soit relié à &(1) par l'équation 
(3.1). 

On peut formuler le problème ainsi : étant donnés pour tout s € [0, T] 
et x E R® un vecteur a(s,x)E R" et une matrice symétrique définie non 
négative b(s, x) d'ordre mXm, on demande de construire sur un espace 
probabilisé un processus &(s) que le processus 


{ 
$()—#(0)— [ a(s, S(s)) ds, 1€ (0, T], 
0 
soit une martingale continue de carré intégrable et de caractéristique 
f 
Î b{s, E(s)) ds. 
0 


Le processus cherché étant continu, on peut considérer que l'espace 
probabilisé est confondu avec l'espace de toutes les fonctions continues 
x(t) définies sur [0, T] et à valeurs dans R”. Ceci étant, on admet que 
£(r) = x(1), et le problème consiste à construire sur l'espace des fonctions 
continues une mesure telle que x(r) satisfasse les conditions énumérées 
ci-dessus. Enonçons le problème avec plus de rigueur. 

Problème. Soient données: a) une fonction mesurable a(s, x), s € (0, 7], 
x € R", à valeurs dans R" ; b) unc fonction mesurable Ü{s, x}, s € [0, T}, 
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x € R", dont les valeurs sont des opérateurs linéaires symétriques définis 
non négatifs de R” dans À”. 

Désignons par 9 l’espace de toutes les fonctions continues défnies sur 
[0, T] à valeurs dans R”' et soit ÿ! la plus petite tribu des parties de {2 de la 
forme {x(r)€ 1}, rE[s, t], où 0<s<t/<T, 1" étant un borélien 
de R”. 

Pour s € [0, T Jet x € R“ donnés, on demande de construire une mesure 
probabiliste P,, sur l'espace mesurable (42, 1) telle que : 

1) P,.{x(s) = x} = 1; 

2) le processus 


(0) _x6)- f a(r,x(r))dr, 1E{s,T], 


soit une martingale par rapport à (%°, P,,) de carré intégrable dont la 
caractéristique soit définie par la formule 


j b(r, x(r)) dr. 


Le théorème suivant exprime des conditions assez larges d'existence 
et d’unicité de cette mesure. 
Théorème 5, Si dans le problème énoncé plus haut les fonctions &(t, x) et 
b(t,x), 1€ [0,T],x € R°, satisfont les conditions : 
A) br, x) est continue en l'ensemble des variables et pour une constante 
C>Oona 
(be, x)0, 0) = C10F 


pour tous lest E[0,T],x,0€ R" ; 

B) pour tous 1€ [0,T]et x E R" la matrice b{t, x) est définie positive, 
c'est-à-dire (b{r, x)0, 0) > O pour tous les 0 € R"et0 #0; 

©) à(t, x) est mesurables et bornée, alors quels que soient s € (0, T] 
et xE R°, il existe une mesure probabiliste unique P2:° sur l'espace (9, %:) 
vérifiant les conditions 1) et 2). Ceci étant, le processus (x(r), 31, Pé:°) est 
markovien. 

Ce théorème dit que le processus 


EE) = x(t)— x(s) — f ar,x(r))dr, 1€{s,T], 


est une martingale de carré intégrable par rapport au flot de tribus 
(8,16€ [s, TJ} et à la mesure P£”. Si 1), 1 E[s, T], est un processus 
nue d'ordre /Xm subordonné au flot de tribus {%, 2€ [s, T]}, et 
tel que 


P:, { f Tr (n() b(s, x(0)) n°(e)) de < =] = À, 
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alors de même qu'on a défini les intégrales stochastiques par rapport au 
processus wienérien on peut définir l'intégrale stochastique 
r 


Î 4) dé(r). 


Si de plus 
? 
Est | Tr (y) br, x()) n°(r)) dt < ce, 
alors le processus séparable 


j x) dé(),  1€fs,r], 


sera une martingale continue de carré intégrable par rapport à (%!, P‘:°) de 
Caractéristique 


0 
Ê 960) br, x) n°Q) dr. 


En particulier, si l'on admet que (1) = br, x(r)), où br, x) 
est la racine positive symétrique de l'opérateur positif b-'(#, x}, on obtient 
que le processus 


t 
ut) = fous 7,A(r) dé(r), 1t€fs,T], 


est un processus wienérien par rapport à (%1, P#:°), et de plus 
ê 
ë(t) = (| br, x(r)) dur), 1>5, 


où b"!{(#, x) est la racine positive de l'opérateur b(s, x). 

Donc, dans les conditions du théorème S pour tous 5€ [0,7] et 
x € R" il existe un processus u{r), 1 = s, de dimension m, défini sur {2 tel 
que le processus (w{r), 34, P#:°) soit wienérien 


t 0 
: x) = x + Î a(r, X(r)) dr + (| br, x(r)) dur) 
P:,?-presque partout pour tous les # € [s, T]. 

Désignons par Ÿ: la plus petite tribu de parties de 92, de la forme 
(“M EL}, où rEfs,t], T étant un borélien de l’espace R*. De toute 
évidence $: d1 11 résulte de la remarque 2 suivant le théorème 1 que si 
les cocfficients ar, x) et b"*(1, x) sont suffisamment lisses, alors % € &. 
Cela signifie que dans ce cas on peut construire Ja solution de l'équation 
différentielle stochastique uniquement à partir du processus wienérien w{f) 
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et des cocfficients de l'équation. En général, ceci n'est pas possible ainsi 
que le montre l'exemple suivant. 

Exemple. Soit »17 = |. Désignons par Q la mesure wienérienne 
sur l'espace (9, 2), de sorte que le processus (x(r), 32, Q) cst un proces- 
sus wienérien et de plus x(0) = O0 Q-presque sûrement. 


Posons 
1 pour x=0; 
(x) = 


—1 pour v=< 0. 


Définissons le processus &(r), ? € [0, T], en posant 
ë(s) = Î a(x(s)) dx(s). 
0 


Il est immédiat de voir que le processus (£(r), %?, Q) est encore wienérien, 


d'où la relation 
t 


X() = Loft) ds), 


0 


qui est Q-presque sûrement vraie pour tous les # € [0, 7]. Donc, le processus 
x) est solution de l'équation 


dx(r) = o(x(0)) dË(r) 


avec la condition initiale x(0) - 0. 


On démontre par ailleurs que 
C) 


ET 
#Q) = LxU)I— lim = À Xio, (xD) ds, 


0 


OÙ Yo, %) st l'indicateur de l'intervalle [0, e]. De cette formule il s'ensuit 


que &(r) est mesurable par rapport à la plus petite tribu des parties de 4 
engendrée par les ensembles de la forme {x(:): |x(s)l € l'}, où s € (0, r], 
1" est un borélien de [0, œ{. Donc, la tribu %? est bien plus riche que la 
plus petite tribu engendrée par les valeurs du processus &(s) pour s «& ! ; 
Par suite, il est impossible de construire une solution de l'équation unique- 
ment à partir du processus wienérien &(r). Signalons encore que l'équation 
de l'exemple considéré ne possède pas une solution unique : le processus 
— x(t)est solution avec x(r). 

En conclusion de ce numéro, énonçons un théorème qui généralise un 
peu le théorème S. 

Théorème 6. Supposons que la fonction b{t, x) est celle du théorème S et 
que la fonction à(t, x) vérifie pour un p — m+2 la condition C') suivante : 


r 
f (| lat, x)l? di dx < ©, 
0 R" 
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Alors pour tous s € [0, Tlet x € R" il existe sur l'espace (9, %}) une mesuré 
probabiliste P°:? satisfaisant les conditions précédentes 1) et 2). De plus, 
le processus (x(r), Si, P#:*) est markovien. 


19.3.5. Dérivation des mesures associées aux solutions d'équations dif- 
férentielles stochastiques. Le théorème suivant nous dit que la solution 
d’une équation différentielle stochastique de coefficient de transfert non 
nul est susceptible d'être obtenue à partir de celle de l'équation corres- 
pondante de coefficient de transfert nul, moyennant un changement de 
mesure absolument continu. 

Théorème 7. Dans les conditions du théorème 5, les mesures P°:° et 
P2.? sont équivalentes, et de plus 


r 
DE = exp | [ (= "€ +00) es, x), 4x) 


+ J (o71(r, x(6)) at, x(0)), à(r, x(1))) dt}. 


On remarquera que la première intégrale du second membre est une 
intégrale stochastique par rapport à une martingale. 

Nous allons formuler un théorème qui implique en particulier qu'il 
n'existe pas toujours de proposition analogue au théorème 7. 

Théorème 8. Soient données des fonctions «{x) et b(x) à valeurs dans 
R® et LT(R®) respectivement, où L'(R*) est l'ensemble de tous les opérateurs 
linéaires symétriques positifs de R° dans R*. Supposons que : 

1) existent des constantes C', et C, positives telles que pour les x,0 € R®= 


Ci 101 < (6(0)0, 0) & C,10/ ; 
2) pour tous les x, y € R® 
Ib(x)— 60) II « KIx-y{5, 


où K et « sont des constantes positives, &« = 1, ||°|| est la norme sur L*(R®), 
a ||, /a norme sur R" : 
3) pourunp > m 
I] [a(x) |? dx < 0, 


RAR" 


Sous ces conditions, pour chaque x € R" il existe sur l'espace (9, Ÿ) 
(9 est l'ensemble de toutes les fonctions continues définies sur [0, [, à 
valeurs dans R°, % est la plus petite tribu des parties de 2 contenant toutes 
les tribus $% pour T < co), une mesure P£°* telle que 

a) P£° {x(0) = x} = 1 ; 
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b) le processus 


x()—x(0)— ï a(x(s)) ds, 1>0, 
0 


est une martingale de carré intégrable par rapport à (%9, P2*) dont la carac- 
téristique est définie par la formule 


j Hx(s)) ds. 


Le processus (x(+), à?, PS?) est un processus markovien homogène. Si 
m=2etp-moum= le p> 2, les restrictions des mesures P2° et 
P90 aux tribus N% sont équivalentes pour tout T > 0. Sim = 1 et 1 < p < 2, 
les restrictions des mesures P%% et P2% aux tribus N9 ne sont généralement 
équivalentes pour aucun T > 0. 

A noter que si les restrictions des mesures P£:? et P2:? à la tribu $9 
sont équivalentes, la densité a pour expression : 


r 


,3 ° 
ns = Xp ] (27 (x 65) a(x(s)), d(s)) 
0 


+ J (b= (x 0) a(x), ax) def. 


19.4. Intégrales stochastiques/par rapport à des mesures poissonniennes 


19.4.1. Définition d’une intégrale stochastique par rapport à une mesure y. 
Soit R! un espace euclidien de dimension /. Désignons par #,, e — 0, la 


tribu des boréliens de R! contenus dans l'ensemble { ER ,e<lrx| << 


& +} et par %, la réunion des tribus 5, étendue à tous les & € ]0, 1]. 


Supposons par ailleurs que sur un espace probabilisé (9, %, P) est 
donné un flot de tribus {%,, / € (0, T]}, #,€ ÿ. On dira que sur l'espace 
[0, T]X R! est définie une mesure poissonnienne si à tout borélien 4 de [0, T] 
Rs tout À © %, est associée une variable aléatoire »(4, 4) sur (Q, %, P) 
telle que : 

1) pour tous À € , et ? € [0, T] la quantité r»((0, r], 4) est ,-mesurable 
et la quantité »(}r, +4], 4), Yh = 0, ne dépend pas de la tribu %Y, ; 

2) siles boréliens :1,, 12, ..., 14, de [0, T] et lesensembles 4,, 4,4, ...,4, 
de %, sont tels que les ensembles 4,X 41, 4:X An ..., .1,X24, sont 
deux à deux disjoints, alors les variables aléatoires »(:1,, 4), ..., v(4,, 4,) 
sont mutuellement indépendantes ; 
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3) si les ensembles boréliens 1, & = 1,2, ... de [0, 7'}et les ensembles 
An k = 1,2,... de %, pour un € = 0 sont tels que les ensembles 41, X 4,, 
J,k= 1,2... sont deux à deux disjoints, alors 


[U A Ü 4.) = 


E-1 


> "44, A5) 
kr: 


j i 


presque sûrement ; 
4) la variable aléatoire »( 1, 1) admet une loi de Poisson pour laquelle 


Er( 1, 4) = 141 //(4), 


où |<1| est la mesure de Lebesgue du borélien .1 de [0, 7°} et 2/(4) une 
fonction numérique sur #,, et de plus 0 < 7/(A4) < © pour À € 3,. 

Par définition, si 4,€ %,, n = 1, 2, ... pour € > 0 et les ensembles 
A, sont deux à deux disjoints, alors 


n(Ü 4.) = SHA). 
n=i n=i 


Donc, /1(4) est une mesure sur la tribu des boréliens de l'espace R!, Ceci 
étant /7(4) — , pour tout À, mais d'une façon générale 


HQIX I — €) + 00, HIx > 6)) := 0. 


Posons #41, À) = »(44, A)--].11 + 2/(4) pour AC [0, T], AE. 

On se propose d'étudier les intégrales stochastiques par rapport à 
la mesure ÿ. Désignons par /Z.(11) l'ensemble de toutes les fonctions 
aléatoires gr, x) = gr, x, m), 1€ (0, T], x € R!, «& € £2, à valeurs réelles, 
mesurables par rapport à l'ensemble des variables. À 1€ [0, T] et x e R!' 
fixes, la variable aléatoire g{7, x) est %,-mesurable ct 


r 


PÉf Jet, x) drli(dx) — =] = |. 
Xl 


Théorème 1. 4 fuute fonction aléatoire g € ILATT) on peut associer une 
quantité aléatoire J#{@) de telle sorte que : 
A) si Pis Pa € HAUT) et à, et «, sont des constantes arbitraires, alors 


JPG taspe) = Jp) +@2J8(pa) ; 


D) si 41 x 4(, X) est l'indicateur de l'ensemble NX A, alors 
JL x 0) PCA, À); 


Tr 
csiqe Her [ [gt x) deli(dx) <<, 


CO L 
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alors 
F 
EJ?(p) = 0, ER) = [ [ Ep*t, x) deli(dx) ; 
o A! 


d) sig € HTC), alors pour tous N—0eC=0 


r 
P{J£G)l - Ces + del) ] UN) dx) — N 
oO kl 


Définition. /.a quantité aléatoire J$(g) s'appelle intégrale stochastique 
de la fonction 4: par rapport à la mesure poissonnienne ÿ et se note 


JG) — f J ge, x) 5(dt, dx). 


On dit qu'une fonction g € 47,(11) est en escalier si existent une parti- 
tion de l'intervalle [0, 7°] par les points O0 =: 4 <#, < ... < 1,7: Tet une 
représentation de l'espace R! par une somme de boréliens An Ages An 
deux à deux disjoints, telle que LA soit constante sur les ensembles de 
la forme [4,4 , [XX 45, # = 0, 1, 1,7: 1,2,...,n. Pour la fonction 
en escalier y on a manifestement | 


Ie) = S Cas fau A5, 
144!) $ » 1j Un anal 1) 


où C, est la valeur de la fonction 4: sur l'ensemble [n, 4, ,[X 4. 
Si p est une fonction arbitraire de HA(J/T)et ,, n = 1,2, ..., une suite 
de fonctions en escalier de /7,(/7) telle que 


r 
lim P ] | lg, Ge, x), x) dll(dx) > | = 0, Ve-0 


il résulte alors de la condition d) que la suite de quantités aléatoires J2(ç,) 
converge Stochastiquement vers une quantité aléatoire. Cette quantité 
n'est autre que l'intégrale J£(r). Si g € H.(IT) et 


! 
[ [Ey*G, x) dilI(dx) = ce, 


n AR! 


on peut exhiber une suite de fonctions en escalier y, € /1.(11) telle que 


r 
im fEIg,6, x) -g@, x)E dx) + 0 


nm -e. 0 DL 
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donc, dans ce cas la suite J2(g,) converge en moyenne quadratique vers 
une quantité aléatoire qui est l'intégrale stochastique J?(y). 
Si € HA(ID), la modification séparable du processus 


[ [et x) F(dx, ds) 
o I 


est un processus ne présentant pas de discontinuités de seconde espèce. 
Ceci étant, 


[l as, N) F(ds, dx) 
0 


Al 


= d <t 


+P [l ( gr, x) dtII(dx) > x 


0 nr! 


Si, d'autre part, 


Eg{(1, x) dtIT(dx) < ©, 


R! 


Cr 


alors le processus 


[ fes, x) 55, dx) 
o 2! 


est une martingale de carré intégrable (sans discontinuités de seconde 
espèce) dont la caractéristique vaut 


[ Les, x) dsl). 
0 R! 


En outre, 
! a 
1 
P{ sup gs, x) ds, dx)| >= Ci <« — Eg'{s, x) dsIl(d x) ; 
lue, J a [ 
t 2 r 
E sup |[ [ot x)5ts, dx)| <4 [ [Eg%, x) ds Id»). 
0«I«<T|o ki 0 A! 


19.4.2. Intégrales stochastiques par rapport à une mesure v. Définissons 
une intégrale stochastique par rapport à une mesure poissonnienne ». 
Introduisons la classe Æ/,(71) des fonctions aléatoires gr, x) = g{t, x, w) 
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mesurables par rapport à l'ensemble des variables, Ÿ,-mesurables pour 
chaque t et telles que 


r 
ri Î 1gG, x)! dtII(dx) < >| = |. 
0 na! 
Pour g € H{(I)N H,A(IT) posons 
r T r 
[ Pot 0 vtr, dx) = [ [rt )6G@r, dx)+[ (76, x) dtIi(dx). 
0 RI o A! o ki 
D'où, par passage à la limite, on peut définir l'intégrale 
r 
[ [ot x) vdi, dx) 
CR 1 


pour toutes les fonctions y € /7,(/7). Si en outre 
r 


ff Eg(, x) dtli(dx) < ©, 


0 Rî 


alors 
r r 
E|f [et x)r(, dx)| < [ [E1y6, 1 dtIT(dx). 
0 ki o ri 


On remarquera que la modification séparable du processus 


[ LeGs, 1) vds, dx) 
Al 


est un processus sans discontinuités de seconde espèce. 


19.4.,3. Formule de Ito généralisée. Soit donné sur un espace probabilisé 
(9, $, P) un flot de tribus {%,,1€[0, T}}, € Y. Soient w{1) = 
= (w'(r), ...,w’(r)) un processus wienérien de dimension r, adapté au flot 
(Sn 1 € [0, T]}, v(df, dx) une mesure poissonnienne adaptée (au sens du 
n° 19.4.1) au même flot, définie sur [0, T]X R! et ne dépendant pas du 
processus wienérien u{f), Er(df, dx) = dtIT(dx). 

: Si un processus £(r), # € [0, T], de dimension #7 peut se mettre sous la 
orme 


0 t 
#0 = 80) + [ as) ds+ [ b(s) du(s) + 
0 0 


0 
4 [ fots, ») 5Gs, dy), 1€[0, TI, 


0 «il 
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où «4{) est un processus de dimension #7 subordonné au flot %,, b(1) un 
processus matricicl d'ordre #7X7r dont tous Îles éléments appartiennent à 
l'espace FZ.,[0, TT] (cf. n° 19.2), ct, x) = ct, x, w) un processus vectoricl 
de coordonnées c(1, x) € F1,(11), k = 1,2, , 0 On dira alors que le 
processus (1) admet la différentielle stochastique : 


dE) == ar) dt + bn) dutr)4 | ce, y) Ft, dy). (4.1) 
R! | 


I est clair que la différentiation stochastique est une opération linéaire. 
Indiquons maintenant la formule de différentiation d'une fonction com- 
posée. 

Théorème 2. Si un processus (+), 1 € (0, T°}. de dimension m admet une 
différentielle stochastique (4. et JU, x), 1 C0, TI, x € R°, est une fonction 
réelle deux fois continiment dérivable par rapport à x et continäiment dérivable 
par rapport à 1, telle que 


r 
, C Of (1, ©) 
ë : QT # 1 : LEZ À 
l [ IQ EG) tot, »))—/ (1, ë()) À: (4, ») di dt1(dy) | 
uv x! 
presque sûrement, alors le processus Lt, E(0)), 1€ 10, TT'admet une difléren- 
tielle stochastique et 


Ë d1 (1. à 
dy(t, 0) = du D TA (1), 


| a 4 it $()) 
| ) P() PU: | 
LR 7 à 1 Ox' oxt 


+ | LG 84 cu, n)-7 (0, 80) - 


LU 


&=1 


: O/(r, Cr) | 
— ÿ (4, ») nee on Hd) dt t- 


se? ) CE 
> > ga 0 po dut) à 


Us 
EU Ji êx 


k ( {4 EU) + CG, »))-J (4 SO)} rtdt, dy). 
x! 


Cette formule s'appelle formule de Ito généralisée. La formule de différen- 
tiation d'un produit de deux processus exhibée plus bas en est une con- 
séquence. 
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Supposons que des processus &,(4) et £.(1) (de dimension un) admettent 
les différenticlles stochastiques 
dé) = a) dt 4:b;(4) dur) + f ce, ») v(dt, dv), = },2. 


R! 
Alors (c,€ HAT)N HI) 


d(£() 0) = 8,0) dE) 1 EC) dë(n) + 
+ b,(4) b.() di : Î C0, ») 4, ») vdt, dy). 


FA 


19.5. Equations différentielles stochastiques 
pour les processus à discontinuités 


19.5.1. Théorème d'existence et équation de Kolmoygorov. Soient donnés : 
- vo espace probabilisé (9, %, P) et un flot de tribus {%,, € (0, TJ}, 
OCT ; 

b) un processus wienérien w{1) : (w'(1), ..., w”(r)) de dimension #1 
adapté au flot de tribus %, ; 

e) une mesure poissonnienne r(dr, dx) définie sur [0, 7]X< R®* adaptée 
au flot de tribus %$,, indépendante du processus w{r) et telle que Er(dr, dx) : . 
= MIT(d\) ; 

d) un vecteur aléatoire £, € R* X-mesurable ; 

c) des fonctions «af, x), ur, x) et ct, x, »), EC [0, T1, x, JE RM à 
valeurs respectivement dans À”, LCR®*) ct R7, où Z.(R*) est l'ensemble de 
tous Îles opérateurs linéaires de À" dans R”" ; on admet que toutes ces 
fonctions sont mesurables en l'ensemble de toutes les variables. 

Considérons l'équation différentielle stochastique 


dE) = ar, E0)) de vos, E0))dut+ À e(e, EG), y) Ftdt, dv) (5.1) 
km 


avec la condition initiale 
£(0) - &,. 


L'équation (5.1) peut sc mettre sous la forme intégrale : 
4 ‘ 
C()  i,1 f a(s, ECS) ds 1 [o(s, £(s)) duts) t- 
0 o 
! 
+ (| fes, Ë(s), ») F(ds, dy), 
o a! 


où (1), 1€ [0, 7], est le processus cherché. 
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Définition. On appelle solution de l'équation (5.1) un processus E(r), 
1€ [0, T] de dimension m subordonné au flot de tribus {%,, 1€ (0, T], tel 
que 

1) toutes les coordonnées du processus vectoriel a(t, Ë(t)) soient presque 
sûrement de carré intégrable sur [0, T] ; 

2) Tous les éléments du processus matriciel o(1, E(r)) soient presque 
sûrement de carré inrégrable sur (0, T] ; 


Tr 
[ [c(s, ë(s), »)[ ds1{(dy) < © 


presque sûrement ; 

4) le processus (1) udmette une différentielle stochastique (5.1). 

Formulons le théorème d'existence ct d’unicité de la solution de l'équa- 
tion (5.1). 

Théorème 1. Supposons que les coefficients de l'équation et la mesure 
IT satisfont les conditions : 


À) il existe une constante K telle que pour tous les 1€ [0, T], x E R”, 
l'on ait 


lat, N)E+ o(, DE + (| Lee, x, ») EF ZI(dy) < KO + 1x), 
Rm 


où 
0] 


GP = À (ut Y à 
J (] 


. 2 


B) pour tout R = Oilexisteune constante Cr > telle que pour \x| & R, 
lyl< Rett€[0,T] l'on ait 


ar, x)— at, PE lo(r, x) — 0, D É+ 
+ f Îc(r, X, z)— ct, +, 2) À II(d 2) = €: PESTU 
Re 


Sous ces conditions, l'équation (5.1) admet une solution unique continue 
à droite, ne présentant pas de discontinuités de seconde espèce et vérifiant la 
condition initiale E(0) = &,,. 

On remarquera que pour cf, x, ») = 0 ce théorème sc spécialise en 
le théorème 1 du n° 19.3. 

On démontre par ailleurs que si l'on se place dans les conditions du 
théorème 1, la solution de l'équation (5.2) possède la propriété de Markov, 
c'est-à-dire est une fonction aléatoire markovienne. Sa probabilité de 
passage P(s, x, ?, l”) s'écrit 


P(s,x,t,1) = P{,(N)ETY, 0O<s<t<T, XxER*, TES, 
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où # est la tribu des boréliens de R*, &,,(), 1 € [s, T], la solution de l'équa- 
tion 


EG) = x+ [afr, Er) dr + [o(r, &,,(r)) du(r) + 


+[ fer, Er), ») 5Gdr, dy). (5.2) 


s RM 
Enonçons enfin un théorème qui nous dit que sous certaines conditions 
subsidiaires sur les coefficients de l'équation (5.1), la fonction 
vs, x) — E/ (ET) 


est solution d'une certaine équation intégro-différentielle. 

Théorème 2. Si l'on se place dans les conditions du théorème 1 et que 
l'on admette que : 

1) les fonctions a(t, x) a(r, x) et cr, x, p), i,j = 1,2,...,m,t1€([0,7] 
sont deux fois continfiment dérivables par rapport à x ; 

2) les dérivées partielles premières et secondes par rapport à x des 
fonctions ar, x) et o(t, x), à, J = 1,2, ..., m, sont uniformément bornées ; 

3) il existe une constante L = 0 telle que 


Ë [LE (Fr? X, 2) n ÿ (< + 2)\' + 


É 
+2, Fra) ] II(dy) < L ; 


4) la fonction f(x) est deux foix continment dérivable par rapport à 
x et bornée avec ses dérivées partielles première et seconde, alors la fonction 


u(s, x) = E/(ET)), 0Æs<T, xER”, 


où &,,(t) est solution de l'équation (5.2) sur l'intervalle {s, T], est solution de 
l'équation 


SE x) x), 1 = | Ou(s, x) 
RU À SX +3 a. À TX) dx dx 
+ | [6 x+ cs, x, y))—t(s, 9 cs, x, }) LA | II(dy) = 
Rem 


avec la condition initiale 


Jim us, x) = f(x) 
CE Es 


dans le domaine s € [0, T], x € R®,. 
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TROISIÈME PARTIE 


Statistique mathématique 


Chapitre 20 
TEST D'HYPOTHÈSES STATISTIQUES 


20.1. Notions fondamentales et problèmes 
de statistique mathématique 


20.1.1. Espace des échantillons. Les méthodes de résolution des problèmes 
proposées par la théoric des probabilités impliquent la connaissance de 
diverses caractéristiques probabilistes. Ces caractéristiques ne peuvent 
être connues à priori. La statistique mathématique est cet outil qui nous 
apprend à les déterminer. 

Un des plus importants problèmes consiste à définir la loi d'une varia- 
ble aléatoire sur le vu des observations de cette variable. A ce problème 
général se ramènent de nombreux problèmes particuliers, tels la détermina- 
tion de la probabilité d’un ou de plusieurs événements, la loi conjointe de 
plusieurs variables, etc. 

Si l'on conçoit la détermination de la fonction de répartition comme 
un problème de statistique, il ne faut pas perdre de vuc que ce terme reste 
à définir et selon ce qu'on entendra par détermination statistique on ob- 
tiendra tel ou tel problème de statistique. 

Pour résoudre les problèmes de statistique on part d'une suite d'obser- 
vations indépendantes d’une variable aléatoire. Autrement dit, on admet 
qu'on effectue une expérience aléatoire dans laquelle on observe une va- 
riable aléatoire et on réalise # épreuves indépendantes de cette expérience. 
La suite (v,,x., ..., x,) des valeurs observées de la variable aléatoire x 
s'appelle échantillon aléatoire issu de la variable aléatoire parente x, le 
nombre d'observations, taille de l'échantillon. L'ensemble de tous les 
vecteurs {v1, Ve, ..., x,} observables pendant les n réalisations de l'expé- 
rience forme l’espace des échantillons. Du point de vuc de la théorie des 
probabilités, l'échantillon (x,, x, ..., x,) est une suite de variables aléa- 
toires indépendantes de même fonction de répartition. On a affaire à un 
problème de statistique si la fonction de répartition commune des variables 
x, est inconnue. 
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Les problèmes de statistique dont les principaux sont formulés plus 
bas diffèrent par la classe des fonctions de répartition et par l'information 
que l'on veut recucillir sur ces fonctions. 


20.1.2. Test d’une hypothèse simple. Une fonction de répartition inconnue 
F appartient à une classe de fonctions de répartition %. On conclut par des 
raisonnements à priori que F = F,€ %. Il faut confirmer ou infirmer cette 
hypothèse sur le vu des observations effectuées. Par exemple, % est l'ensem- 
ble des fonctions de répartition de la loi normale, F, la fonction de réparti- 
tion de la loi normale réduite. 


20.1.3. Test d’une hypothèse multiple. Une fonction de répartition inconnue 
F appartient à %, Soc. Il faut vérifier l'hypothèse : FE Yo. Par 
exemple : vérifier l'hypothèse qu'une variable suivant la loi normale a une 
espérance mathématique nulle. Dans ce cas % est confondue avec la classe 
de toutes les fonctions de répartition de la loi normale, %,, avec la classe 
de toutes les fonctions de répartition de la loi normale d'espérance mathé- 
matique nulle. 

Le test d'une hypothèse simple ou multiple se ramène au test d’une 
hypothèse statistique. Un test est défini par la donnée d’une région critique 
G dans l'espace des échantillons. Si l'échantillon est situé dans la région 
critique, l'hypothèse est rejctée. La qualité d’un test est déterminée par la 
probabilité de rcjeter une hypothèse vraie. Plus cette probabilité est petite, 
plus le test est bon. Par ailleurs, le test est caractérisé par les probabilités 
de ne pas rejeter (d'accepter) une hypothèse fausse (cette probabilité dépend 
naturellement du caractère de la loi vraie). Il est souhaitable de rendre ces 
probabilités aussi petites que possible. 


20.1.4, Estimation du paramètre d’une fonction de répartition. On admet que 
la fonction de répartition inconnue appartient à une famille de fonctions 
de répartition F(9, x) dépendant d'un paramètre 0 € ©, où © est un en- 
semble de la droite ou d’un espace euclidien de dimension finie. Autrement 
dit, la fonction de répartition dépend d’un ou de plusieurs paramètres 
réels. Ainsi, par exemple, la famille des fonctions de répartition sur la 
droite dépend de deux paramètres réels : l'espérance mathématique et la 
variance. Il faut sur le vu des observations estimer un paramètre (ou plu- 
sieurs paramètres). Pour construire les estimations, on se sert des statistiques 
ce fonctions des valeurs empiriques. Comme exemples de statistiques on 
a la : 
moyenne empirique 


1 n 
X, = — X; 
ée 2 ch 


la variance empirique 
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(vi, ..., A) st un échantillon de taille z. Pour estimer le paramètre réel 
1 on se sert d'une statistique O, (x, ,-.. Y,) dite estimateur dont une réalisa- 
tion est une estimation de 0. La qualité de l’estimateur est déterminée par la 
loi de la variable 

8x OR CECI X,)—0 


(cette loi dépend manifestement de la valeur du paramètre cherché). Cet 
estimateur sera bon si la loi est suffisamment concentrée autour de 0. Dans 
la pratique on se limite généralement aux deux premiers moments de 
l'estimateur. Dans ce cas l’estimateur est caractérisé par le biais 


FE (x, Nas. Xa)— 0 
ct la variance 
Eo(0, (x: Vaso. x,)— E00, (x » Vas.) x) 


(Ee désigne l'espérance mathématique à la condition que la fonction de 
répartition vraie soit confondue avec F(6, x)). L'estimateur dont le biais est 
nul est dit sans blais. La qualité d'un estimateur sans biais est déterminée 
par la valeur de la variance : plus celle-ci est petite plus l’estimateur est bon. 


20.1.5. Région de confiance des paramètres. Les conditions du problème 
sont mêmes que dans le numéro précédent. Mais au lieu d'un estimateur 
du paramètre on construit une région de confiance, c’est-à-dire une région 
S de © pour laquelle la probabilité que S contienne la vraie valeur du 
paramètre est = 1 —-æ« (ce nombre, appclé coefficient de confiance, doit 
être assez proche de 1). La région de confiance est construite d'après les 
valeurs empiriques. Elle est déterminée par une fonction définie sur l’espace 
des échantillons et dont les valeurs sont des domaines de ©. Si l’on estime 
un paramètre réel, on se sert d’intervalles de confiance dont les bornes sont 
définies par deux statistiques. Soit S(x,, x, ..., x.) une région de con- 
fiance. La qualité d’une région de confiance est caractérisée par son cocffi- 
cient de confiance ainsi que par sa forme et ses dimensions. 


20.1.6. Problèmes généraux des décisions statistiques. En principe définir 
la fonction de répartition d’un paramètre inconnu, retenir telle ou telle 
hypothèse fait partie d’un problème plus général de décision. Prendre une 
décision, c'est accepter une hypothèse ou, de façon plus compliquée, opter 
par exemple pour un procédé de choix de graines à chaque étape de la 
sélection d’une nouvelle sorte et ensuite fixer définitivement son choix sur 
les graines qui réunissent les caractères nécessaires. Toute décision est prise 
sur le vu des observations de données statistiques (dans l'exemple précé- 
dent, ce sont les données sur les diverses propriétés des graines obtenues 
dans les terrains d'essai). Dans chacun de ces problèmes on dispose d’un 
ensemble de décisions possibles D. La règle de décision est donnée par une 
fonction d(x;,x2, ...,x,) définie sur l'espace des échantillons et à valeurs 
dans D, appelée fonction de décision. On admet que toutes les lois de proba- 
bilité de l'échantillon appartiennent à un ensemble de lois de probabilité 
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D. Pour juger la qualité de la règle de décision, on sc sert de la fonction 
de perte W(d, P) qui détermine le préjudice causé par le choix de la décision 
d si la vraie loi de l'échantillon est P € D (la perte peut être négative). II 
est intuitif de rechercher des règles qui minimisent la perte moyenne. 


20.1.7. Analyse séquentielle. Les lois séquentielles jouent un rôle particu- 
lièrement important parmi les règles de décision. Il est commode de con- 
sidérer dans ce cas un espace des échantillons infini, puisqu'on utilise des 
échantillons de taille aussi grande que l'on veut. La règle séquentielle indique 
pour quelle valeur de x selon l'échantillon (x,, x2, ..., x,) il faut inter- 
rompre les observations et quelle décision prendre dans ce cas. Ainsi dans 
un test séquentiel entre deux hypothèses on observe successivement les 
variables x,, x., ... et pour chaque # = 1, 2, ... on prend l'une des 
décisions : d,, la première hypothèse est adoptée, d, la deuxième hypothèse 
est adoptée, d,, il faut effectuer encore une observation (c'est-à-dire ajouter 
l'observation x,,41 à l'échantillon v,, ve, ...,x,). 

La règle séquentielle de décision peut étre décrite par deux suites de 
fonctions. Supposons que 


{ si l'observation cesse au n-ième pas, 
O dans le cas contraire ; 


AN TR à { 


d,(x1, -.., X,), la décision prise au n-ième pas, est une fonction à valeurs 
dans D définie sur la partie de l'espace des échantillons sur laquelle &, = 1. 
On choisit parmi les règles celle qui minimise une certaine perte tenant 
aussi compte du nombre d'observations indispensables. 


20.1.8. Statistique des processus aléatoires. Pour les processus aléatoires 
on pose les mêmes problèmes que pour les observations indépendantes : 
test d'hypothèses et estimation des paramètres des lois de probabilité. Les 
problèmes statistiques pour les processus aléatoires se caractérisent par le 
fait qu'on observe généralement l'unique trajectoire du processus et l'on 
prend des décisions sur le vu de ces observations. Donc, la statistique des 
processus aléatoires est la statistique d’une observation (indépendante). 
Cependant cette observation ne porte pas sur une, mais sur une infinité de 
variables aléatoires (les valeurs du processus à des dates différentes) liées 
entre elles. Donc, la statistique des processus aléatoires peut être caractéri- 
sée comme la statistique des observations liées. Signalons quelques traits 
particuliers de la statistique des processus aléatoires. Premièrement, les 
paramètres dont dépendent les lois de probabilité sont eux-mèmes souvent 
de dimension infinie (ainsi la famille des lois de processus gaussiens dépend 
de deux paramètres fonctionnels : la moyenne et la fonction corrélative). 
Deuxièmement, même sur le vu d’une observation on peut choisir l’une des 
hypothèses ou définir rigoureusement la valeur du paramètre. Il en va autre- 
ment dans les problèmes classiques pour les lois régulières. 

Etant donné que les lois des processus aléatoires ne peuvent en général 
être données de manière efficace, il n’est pas toujours possible de résoudre 
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les problèmes de statistique en utilisant toutes les lois finidimensionnelles. 
Dans les cas les plus simples, on n'utilise que les moments jusqu'à un certain 
ordre. Les méthodes linéaires ont pris une dimension nouvelle. 


20.1,9. Niéthodes linéaires en statistique mathématique. Les méthodes 
linéaires regroupent les problèmes de statistique qui n’utilisent que les 
fonctions moments des deux premiers ordres. En principe, ce sont des pro- 
blèmes d'estimation des paramètres dont dépendent la valeur moyenne ou 
la fonction corrélative du processus. En outre, on n'utilise que des statisti- 
ques linéaires ct quadratiques, c'est-à-dire des fonctionnelles linéaires ct 
quadratiques de la trajectoire observée du processus. Les méthodes linéaires 
ne sont en fait autre chose que l'application de la théorie des espaces hilbcr- 
tiens à la statistique mathématique. 


20.2. Procédure de test entre hypothèses 


20.2.1. Schéma général de construction de tests statistiques (non randumisés). 
L'un des principaux problèmes de statistique mathématique est la construc- 
tion ct l'étude des propriétés de procédures de tests entre hypothèses sur le vu 
des résultats donnés des observations. 

Une hypothèse statistique affirme : le paramètre inconnu Y d’une loi de 
probabilité initiale Po appartient à une partie donnée Æ d’un ensemble de 
valcurs possibles ©. Le complémentaire K :: O\/7 s'appelle alternative 
de l’hypothèse /7. 

Excmplce. On observe un événement aléatoire dont la probabilité 
de réalisation p est inconnue. Pour hypothèse statistique on considère 
l'hypothèse p = p, (0 < po < 1). 

L'hypothèse F7 est dite simple si l'ensemble /7 est constitué d’une seule 
valeur du paramètre /, multiple dans le cas contraire. 

La statistique mathématique a pour objet de vérifier la concordance 
des résultats des expériences avec l'hypothèse admise. On construit à 
cet effet une procédure de test de l'hypothèse qui permet en fonction des 
résultats des observations de rejeter ou d'accepter cette hypothèse. 

L'espace des échantillons est partagé en deux parties : X, ct X,. Pour 
tester une hypothèse on procède comme suit. Si les résultats des observations 
NC X,, on admet que l'hypothèse Z7 est confirmée par les données empi- 
riques, C'est-à-dire l'hypothèse 77 cest acceptée. Si la valeur empirique 
NC N,, l'hypothèse // est en désaccord avec les résultats des observations 
etelle est rejetée. L'ensemble X, s'appelle région d'acceptation de l’hypothèse ; 
l'ensemble X,, région critique ou de rejet. L'événement x € X, étant aléa- 
toire, l'hypothèse 77 est acceptée ou rejetée sur le vu des observations de cet 
événement dont la probabilité est Po{x € X,} pour tout 0 donné. La mise en 
œuvre d'un test d’une hypothèse comporte deux risques : le risque de 
première espèce qui consiste à rejeter une hypothèse vraie et le risque de 
deuxième espèce qui consiste à accepter une hypothèse fausse. 

En construisant unc procédure de test, on aura intérêt à minimiser les 
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risques des deux espèces. Dans la plupart des cas importants, ilest impossi- 
ble de mettre au point des procédures donnant lieu à des risques des deux 
espèces aussi petits que l’on veut. Les procédures de test admettent une in- 
terprétation statistique, savoir si l’on répète une procédure plusieurs fois 
les pourcentages du nombre de décisions fausses sont fonction des proba- 
bilités des risques de première et de deuxième espèces. 

Si les données empiriques x fournies par un test ne sont pas en accord 
avec l'hypothèse, c'est que x € X,. On observe alors avec un risque de pre- 
mière espèce un événement qui contredit cette hypothèse. Si la probabilité 
de cet événement aléatoire est petite, c'est qu'on observe un événement 
pratiquement impossible, auquel cas l'hypothèse admise doit être rejetée 
presque sûrement. 

Si les données empiriques sont en accord avec l'hypothèse admise, cela 
ne veut pas encore dire qu'elles ne le seront pas avec une autre hypothèse. 
Il est impossible de prouver telle ou telle hypothèse en utilisant les tests 
statistiques sur le vu des observations. Tout ce qu'on peut affirmer, c'est que 
les résultats des observations ne contredisent pas l'hypothèse admise. 

Donc, les conclusions tirées sur le vu des données empiriques s'énoncent 
ainsi : /es données empiriques confirment l'hypothèse admise (l'infirment ). 


20.2.2. Puissance d’un test. La probabilité du risque de première espèce 
B(0) = Po(X,), traitée comme une fonction du paramètre 0 € ©, s'appelle 
puissance du test. 

La plus grande valeur possible « du risque de première espèce dans 
un test s'’apelle seuil de signification de ce test (on dit encore niveau du 
test) : 

sup Pe(X,) <= «. 
0€x 


Si un test cest tel que Po(X,) = « pour 9€ FH, la région critique X, cest dite 
semblable à l'espace des échantillons. 

En général le choix du seuil « est régi par des considérations d'ordre 
pratique qui dépendent de l'hypothèse. Si l'hypothèse cest assez vraisem- 
blable, le seuil de signification « est pris assez petit. L'hypothèse sera alors 
rejetée avec une probabilité petite. Le choix du seuil de signification doit 
également tenir compte du comportement de la puissance du test B(0) = 
— P9(X,) pour les valeurs contraires du paramètre 0 € K. On dit qu'un test 
cst sans biais pour AH si 


Pe(X) <a pour 0€H; 
Pe(X)>ax pour 0EK. 


I se peut que pour un seuil « donné la puissance du test (9) soit trop petite 
pour 0€ K, donc le risque de deuxième espèce de l'hypothèse fausse cst 
grand. 

Il est naturel de convenir que le test optimum est celui dans lequel pour 
«a donné la puissance prend sa valeur maximale (problème de Neyman- 
Pearson). 
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En général, tout test optimum pour une valeur fixe du paramètre 
0 € K dépend de UE K. 

Un test X? est uniformément le plus puissant (U.P.P.) si pour tout 
autre test X, on a : 


Pe(X?) = Po(X,) pour 0€H: 
Po(X?) = Pe(X,) pour 0€K. 


Un test randomisé cst défini par une fonction critique g{x) sur l’espace 
des échantillons X dont la valeur est la probabilité d'écart de l'hypothèse 
H pour une valeur donnée x des résultats des observations. La puissance 
d'un test randomisé de fonction critique g(x) est définie par 


PO) = Eo gx) = Î 7(x) Po(dx). 
x 


En particulier, lorsque (x) = {0 DOUE pe x c'est-à-dire lorsque 
la fonction critique est fonction caractéristique de l’ensemble X,, alors le 
test défini par la fonction y devient non randomisé de région critique X.. 

Dans un choix aléatoire simple, les données statistiques sont les valeurs 
d’un échantillon de £. Dans ce cas, l’espace des échantillons X est un espace 
cuclidien de dimension n : x = (x,,...,2x,), où x,(k = 1, ...,n) sont des 
variables aléatoires indépendantes de même fonction de répartition. Le 
nombre # des éléments de la suite empirique s'appelle taille de l’échantillon. 

On dit qu’un test de région critique X, est convergent en probabilité si 


lim Po(X,)=1 pour O0EK. 


n > ro 


Cette définition veut dire que le risque de deuxième espèce tend vers zéro 
pour /1 —+ co. 

Pour comparer des tests, on se sert des mesures d’efficacité asymptoti- 
que qui repose sur l'étude de la vitesse de convergence de la puissance au 
voisinage du paramètre 0 € H. 


20.3. Tests entre hypothèses statistiques 
20.3.1. Test de Neyman-Pearson. La fonction critique g(x) d’un test opti- 
mum de Neyman-Pearson de seuil « entre une hypothèse simple H, à 


laquelle est associée la loi P,(x) et l'hypothèse contraire simple X = H, 
à laquelle est associée la loi P, (x) est définie par les conditions : 


f P(XN) Po dx = a; 
x 


rs 1, pa) > CaPo(x) ; 
0, pilx) < Capo(x), 
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où Po(x) et p,(x) sont les densités des lois P, et P, par rapport à la mesure v. 
Le test de Neyman-Pearson est un test UMP de seuil «. 

Le test de Neyman-Pcarson est utilisé pour vérifier l'inégalité p,(x) = 
> Ca Po(x) pour des valeurs données des observations de x. Si cette inégalité 
a lieu, l'hypothèse F7, est rejetée, dans le cas contraire elle est retenue. 

La constante C4 qui figure dans le test de Neyman-Pearson est définie 


1( 


PQ) 


par le quantile de la loi de la variable aléatoire T(£) = relativement 


à l'hypothèse //(£ suit la loi P,) : 
Po(T(E) = Ca) = &. 


Si les probabilités Pÿ(T(Ë) == Ce) ne dépendent pas des valeurs contraires du 
paramètre 0, le test de Neyman-Pearson relatif à l'hypothèse simple Ho est 
UMP relativement à toutes les hypothèses contraires. ë 

P, (6) 


Po(é) 
tests du rapport de vraisemblance. Ils possèdent de nombreuses propriétés 
utiles (cf. [16].) 

Exemple 1. Soient P(x ; a,u) des densités de lois normales de 
moyennes a et de variance 0°. Considérons l'hypothèse simple A, :a = & 
pour une valeur connue du paramètre a contre la classe des hypothèses 
contraires k : a > a, pour la même valeur de oc. Dans un choix aléatoire 
Simple, x = (x, Xe, ..., N,) est un vecteur #-dimensionnel de variables 
aléatoires indépendantes x,, ...,.v, de même fonction de répartition. Dans 
ce cas, le test de Neyman-Pearson cst déterminé par l'inégalité 


op {fe pren (ÈS) 


En prenant le logarithme de cette expression, on obtient 


(a — &) >, NZ lu. 


Ls=- 


Les tests qui utilisent la loi des statistiques T(£) = s'appellent 


La région critique de la classe des hypothèses 4 > «, est définie par 
D AVE Cas 

& =! 

où la constante C' se déduit à partir de la condition 
Po D VE Ze Ca) = "M, 

TA 

Le test Ÿ x, Ca de l'hypothèse simple H : a = a, est UMP pour la 
k=li 


classe des hypothèses a > a. De façon analogue, le test >, Xe Æ Ca de 
k= 
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l'hypothèse simple 7, : a - a, est UMP pour la classe d'hypothèses 
4 <= Gp. 
Si l'ensemble des valeurs contraires du paramètre « contient les points 
situés aussi bien à gauche qu'à droite de &, il n'existe pas de test'UMP. 
Exemple 2. Lecritère de Neyman-Pearson d’une hypothèse simple 
Ho: a = @ pour une valeur inconnue du paramètre & contre l'hypothèse 
contraire À : a = a, cst définie par la région critique 


X*—@ 2 | © Û 
— si Ca Ÿ = — és (x —ÿ). 
E " n FA n— 1 > 

Exemple 3. Pour l'hypothèse simple 77, : 4 =: 0, contre K: le test 
UMP cest défini par la relation : 5° :> Ca. 


20.3.2. Tests du rapport de vraisemblance, La construction de ce test repose 
Po(x) 
Po,(x) 

Hl cst naturel de choisir la région critique telle que pour x € X, le 
rapport de vraisemblance prenne sa valeur maximale pour toutes les valeurs 
contraires du paramètre 0 € K. 

Le test du rapport de vraisemblance de l'hypothèse simple A, : 0 =: 0, 
contre l'hypothèse contraire multiple UC X est défini par la statistique 


Fes Po si 


Po 0) | 


La région critique cst de la forme X, := {x : /(1) = Ca}, où la constante 
Ca est définie par la condition : Py,(X,) = &. Par exemple pour l'échantillon 
N = (Ni, Nos ..., X,) de la population normale P(x ; 4, o) de paramètres 
inconnus «a ct w, le test du rapport de vraisemblance pour l'hypothèse 
I, : a = a, est défini par la statistique : 


2» LP 
Hx) = (: 1 æ) | 
où f(x) = vi 0 suit “ loi de Student à #-1 degrés de liberté. 
PE #— ee 
(ia X — > Xn) = —— D (va sy) 


Le test du rapport de Vraemblinée d'une hypothèse multiple 4€ 47 
contre l'alternative multiple / € K est défini par la statistique 


sur les propriétés du rapport de vraisemblance Z.(x) = 


dx) - 


sup l'o(x) 
._ DEAR 
SET EC) 
CAE 
20.3.3. Test de 4°. Pour tester une hypothèse simple A, à laquelle est 


associée une loi discrète (p,, ps, ..., Pa), Ÿ Pr = 1, On se sert de la 
1 
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statistique 


_ em, Gr um) 
f 2 QU LA 


où ,1,...,1, SON LS fréquences des apparitions des événements dans 
un échantillon de taille # — -ÿ 1. Si A-»#, la loi de la statistique du 


4° tend vers une loi de 7° à m cures de liberté et de densité 


Ku_1(X) x Te, x 2-0. 


m ! 
eo r(" ‘) 
À 2 


La loi limite ne dépend pas de la forme de la loi discrète initiale. Le teste du 
4° sc définit comme suit. Soit 72 le quantile de la loi du 7° limite : « == 
= P{7° > 75}. Alors la région critique du test du 7° cest définie par 
l'inégalité pour la statistique du 7° : 7° = 7. 

Le test du 7° cest égalciment utilisé pour vérifier une hypothèse simple 
concernant la forme de la loi initiale pour un groupe de valeurs de la va- 
riable aléatoire observée &. Dans ce cas 7, -- P{EE À), où X, sont les 
partitions de l'ensemble des valeurs possibles de la variable aléatoire ë. Le 
test du 7° est assez cflicace pour les fréquences rm, == 10. 

Excmple 4. Dans uncsuite d'épreuves indépendantes on observe un 
événement aléatoire de probabilité »(0 < p < 1) inconnue. Soit v, la fré- 
quence des apparitions de cet événement dans un #-échantillon. Alors la 


. . V — 1 : | ‘ 
statistique 7° -. r ui - Ip p) pour les grands # suit approximativement unc 
CR 
loi de densité A°,(x) — ee ©, x > 0. 
\/27x 


Les tables des quantiles de la loi du 7° (cf. [16]) permettent de vérifier si 
dans un échantillon la probabilité d’un événement aléatoire est égale à un 
nombre donné p. 

Le test du 7° est utilisé dans le cas où l'on à affaire à plusieurs échan- 
tillons indépendants. 

Exemple $ Soient r,,r,,...,r, les Fréquences des apparitions, 
dans des échantillons de taille #,, n,,..., n, d'un événement aléatoire 
dont la probabilité est supposée égale à p. 

Pour tester cette hypothèse, on peut se servir de la statistique 7? = 


a Gen p} . . 
= ———— , dont la | d nds n — m est proche de 
à papy? dont la loi pour de grands n vs È p 


la loi du 7° à »n degrés de liberté. 
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Si la loi initiale dépend de paramètres inconnus 0,, 0,,..., 0,, pour 
tester l'hypothèse on se sert de la statistique 
= Ÿ tennO,0,, 0 
k=! np: (6, 6,,.. .. 6,) : 
où 0,, 8,, ..., Ü, sont des estimations des paramètres sur le vu des obser- 
vations. Sous certaines conditions la statistique 7? suit à la limite pour # -> 


une loi du y? à n7—7r—1 degrés de liberté. 
Exemple 6. Plaçons-nous dans les hypothèses de l'exemple 5 et 


utilisons l'estimation de la probabilité inconnue f = mn Lo 
k= 
(111) 
L 2 ee 1 d liberté 
a statistique 7 D na P) à m—1 degrés de liberté sert à 


tester l'hypothèse d' homogénéité des échantillons, c'est-à-dire l'hypothèse 
que la probabilité de l'événement observé est invariable dans les m échan- 
tillons. 


20.3.4. Tests non paramétriques. Un problème non paramétrique important 
consiste à tester l'accord entre les données empiriques et l'hypothèse que la 
fonction de répartition initiale F(x) est donnée et ne renferme pas de para- 
mètres inconnus. Si la fonction de répartition initiale F(x) est continue, pour 
test non paramétrique on se sert de la statistique de Kolmogorov 
VañD,= y sup a F,(- F(x) |, 
—O<I<+ 
dont la loi ne dépend pas de la forme de F0 et dont on connaît la loi initiale 
(cf. n° 20.4). 
La région critique de seuil donné est définie par 


VüD, >= da, 


où d, est le quantile de la loi limite de Kolmogorov : 1—K(ds) = «. 

Test d’homogénéité des données statistiques. Le problème se pose 
dans les termes suivants : vérifier que les échantillons (x,, x2,..., x,) et 
Os J'as -.., J,) sont issus de variables aléatoires de même fonction de ré- 
partition F(x). Si la fonction de répartition initiale F(x) est continue, pour 
test d'homogénéité des données empiriques on utilise la statistique de 
Smirnov dont la loi ne dépend pas de la forme de la fonction F(x) : 


ni ni 
rm Dan © FGF 
VAL Dar \/2" ru Dar il (x) (M) 


où F, (x) et F,, (x) sont les fonctions de répartition empiriques du premier et 
du deuxième échantillon respectivement. La région critique du test d’homo- 
généité est définie par l'inégalité 


\V/ nm Du>de, 
n+m 
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où d, est le quantile de la loi de la statistique de Smirnov pour n et m petits 
et le quantile de la loi limite de la statistique de Smirnov 1 — X(d,),= « pour 
net m grands. Dans le cas particulier où les échantillons sont de même taille 
(n = m) la loi exacte de la statistique de Smirnov a une expression analyti- 
que assez simple. 

Les tests non paramétriques ordonnés se construisent avec des statisti- 
ques d'une série variationnelle qui ne dépendent pas de valeurs concrètes 
des termes de cette série. 

Le test des séries de Wald-Wolfowitz repose sur la statistique UV, 
ou nombre des séries des valeurs observées du premier et du deuxième échan- 
tillon dans une série variationnelle générale z,<z; =... <2,4,, Où 
z, est soit xy SOit Ju. 

La loi de la statistique UV, ne dépend pas de la forme de la fonction de 
répartition F(x) de la loi initiale : 

U n + 
nn à Ur 
où les variables aléatoires v, sont indépendantes et prennent les valeurs 0 et 


1 avec des probabilités égales à 1/2. Pour n et #1 grands, la loi de la statis- 


- : nn 
tique UV, est asymptotiquement normale de moyenne on. et de 


(a-+m-+1). Pour mn fixe et 71-+> 00, la loi limite de la statis- 


: nn 
variance 
2 
tique _ U,., cst celle de U,, = ). W,, où W, sont des variables indépen- 
CS 


dantes uniformément réparties sur JO, 1[. 
Il existe d’autres tests non paramétriques (cf. [16]). 


20.3.5. Test séquentiel du rapport de vraisemblance. Les expériences sont 
effectuées l’une après l'autre, et à chaque étape il faut décider de leur pour- 
suite ou de leur arrêt. La taille de l'échantillon en analyse séquentielle n’est 
pas fixée à priori, c’est une variable aléatoire. Soient Æ, et H, deux hypothè- 
ses en concurrence sur la forme de la densité de probabilité p,(x) ou p,(x) de 
la variable aléatoire observée. Le test séquentiel du rapport de vraisem- 
blance (Wald) se construit avec l'échantillon (x,, Xe, ...,x,, ...) de la ma- 
nière suivante. On se donne deux constantes 4 et B qui partitionnent l’espace 
des échantillons relativement au rapport de vraisemblance 


P1() 
1-1 Po(x) 
en trois régions pour tout #1 : 
( ; 
la région d'acceptation de A, : X,: II PaQs) > B; 
kml Po(x) 
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la région d'acceptation de 4, : À : Al PQ) < À ; 
à Po) 
Pa (x) 
B. 
1 Po(xa) ù 


L'efficacité du test séquentiel du rapport de nes est détermi- 
née par les risques de première espèce « — P,(N,) et de deuxième espèce 
B = P,(%6) et par le nombre moyen des observations Mov et Mir; le 
nombre aléatoire » des observations est défini par les conditions : 


la région de poursuite des expériences : Xo, : À < Il 


i r 
é Pa (xs) Pa (xs) 
A, B) ; -£ (1, R). 
JT Po (Na) . IT Po(xs) a ) 


Le test séquentiel du rapport de vraisemblance implique en moyenne 
un nombre d'observations inférieur à celui du test dont la taille de l'échan- 
tillon est fixée pour les mêmes risques de première et de deuxième espèce. 

Le test séquentiel s'achève presque sûrement aussi bien pour l'hypo- 
thèse 7, que pour l'hypothèse //,, c'est-à-dire que Pr —<o) :- P,(v < 
<co)== |, 

La définition exacte des bornes À et 72 de la taille moyenne de l'échan- 
tillon Af, » dans un test séquentiel soulève de grosses difficultés. On dispose 
toutefois d'inégalités utiles aux applications : 


Ale halle 
| —-« a 
Mv (1 —«) log B4 «log À 
Mo z 
} = 
(1-— a) log -, =. t « log . 
— œ 
ee Fe n Dre 

où z = log P16) 
o($) 


20.4. Distributions d'échantillonnage 


20.4,1. Série varlationnelle. L'analyse statistique étudie un échantillon 
de taille n (ou n-échantillon) 


Vo No Vue (4.1) 
c'est-à-dire une suite de variables indépendantes x,, 1 -:£-=n, de mème 


fonction de répartition P(x), obtenu par un tirage simple dans une popula- 
tion définie par une variable aléatoire £ de fonction de répartition P(x). 
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La suite des valeurs empiriques rangées par ordre de croissance 
A <<... «x (4.2) 
s'appelle échantillon ordonné ou série variationnelle, Les termes égaux 
entre eux sont rangés dans un ordre quelconque. 


Les termes de la série variationnelle x®% (nr = 1,2, ...,n) sont appelés 


) 
statistiques ordonnées. Le nombre 2, -: _ s'appelle rang du terme x!*. 


La statistique v,(x) égale au nombre des valeurs de l'échantillon 
inférieures à x : 

(= mm) = (AD x <x,}, m=0,1,...,n, (4.3) 

s'appelle fréquence empirique. La variable aléatoire », (x) est égale au nombre 

de réalisations de l'événement {£ < x} dans n épreuves indépendantes, si 


bien que la fréquence empirique »,(x) suit une loi binomiale de paramètre 
p= P{È = x} = P(x) : 


P{r,(x) = m} = CEPRO)(E-PO)S, m:=0,1,...,n. (4.4) 
La loi des termes de la série variationnelle (des statistiques ordonnées) 
se définit de façon simple à l'aide de la loi de la fréquence empirique : 


P{xS <= x) = P{r, (x) 2 mi) = ÿ CP) (1—-P()T EE (AS) 
km 


En particulier, les termes extrêmes de la série variationnelle x{* et x{ 
possèdent des lois de forme simple : 


P {x$” < x) = 1—(1 _ P(x))" : 
P {x < x} = P"(x). 


La loi des termes de la série variationnelle peut être mise sous une forme 
plus commode à l'analyse : 


(4.6) 


d(2) 
>{,(n) À — ni _ à y — À vhr-n , 

PAR = x) Gn— 1)! (n—m)! | "7 (y dy. 0 
0 


La loi (4.7) est une loi de type bêta. 


Si la loi initiale de la population admet la densité p(x) = _ , la loi 


des statistiques ordonnées admet unc densité de la forme 


! 
LR | px) (1 — P(n)}"" px). (4.8) 


Gn—1)! (um)! 


La statistique À, = x%— x", appelée étendue de l'échantillon, est 
d'un usage courant dans les problèmes de contrôle de la qualité d’une 
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d 
—— -(n) « Vi -- 
dx P{x® = x) 


production. La loi de l'étendue est de la forme 
P{xL— x <= n | (P(X+1)-P(x)}"! dP(x). (4.9) 


La loi rigoureuse des statistiques ordonnées est difficile à utiliser en 
analyse statistique, car elles dépendent essentiellement de la loi initiale. 
Il est naturel que cette dépendance s'affaiblisse avec l'accroissement de 
la taille » de l'échantillon. La représentation approchée des statistiques 
ordonnées pour de grands n s’appelle représentation asymptotique, La 
transformation des termes de la série variationnelle à l’aide de la formule 


29 = nP(X") (4.10) 


nous donne la densité de probabilité g{% (z) des variables aléatoires z{® sous 
la forme 
(2) = Cr 27 (-+) (4.11) 
Em JT Cal (£ n j 
Pour z fixe, cette loi de Bernoulli (en 1) s’approxime pour # ->00 
par la loi de Poisson 
271 e”: 
(n) MUR ds cute 
quien zest la densité d’une loi gamma de paramètre »n1 — 1. 
De façon analogue, la transformation des termes extrêmes de la 
série variationnelle par la formule 4", = ni —P(x®,)) nous donne la 
densité de probabilité g{%,(z) des variables aléatoires z{,, sous la forme 


8 (2) = Ce (£) (1 RE (4.13) 


z > 0, (4.12) 


n n 


Pour #-> et m et z fixes, g{,.(z) est approximée par la densité de la loi 
gamma de paramètre mi : 


En (2) & - AS , 2>0. (4.14) 


Les lois de z® et z{®,, peuvent être utilisées pour déterminer la représen- 
tation asymptotique à 1 fixe des termes extrêmes de la série variationnelle. 

Exemple. 1. La fonction de répartition initiale P(x) est uniforme 
sur l'intervalle [—a, a]. Alors pour les termes minimum x” et maximum 
x® de la série variationnelle on a les représentations asymptotiques 


CAE 


n° 


NOTE 


(4.15) 


2a 
(n) ee 
A ( u A—- Z 
L ! 1 » 
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où z est une variable aléatoire suivant une loi gamma de paramètre m = U, 
c'est-à-dire de densité g(z) = e”’,z > 0. 

Exemple 2. La fonction de répartition initiale P(x) admet la 
densité p(x) = . e”lsl, Alorsle terme minimum et le terme maximum de la 


série variationnelle admettent les représentations asymptotiques : 
n 
xf9 œ v—-In-- ; 
ï 2 
(4.16) 


nl 
x® Z ou [UE : In ‘2 ’ 


où vest une variable aléatoire de densité g(v) — e*. 

Si le rang est fini et 1 = [#9], c'est-à-dire pour les »7 entiers vérifiant 
les inégalités 0 —< _— <q< es 
= P(x8,) des termes de la série variationnelle de rang fini nous donne pour 
la variable z® une densité de probabilité g, (z) de la forme 


£{2) = Ca 2-1 (I ÈS 2)", 


<1, la transformation 2! = 


qui, au voisinage du point z = g, est approximée par la densité d’une loi 


normale de moyenne q et d'écart \V/ 2 . Ceci nous permet d'écrire 
la représentation asymptotique de la variable aléatoire z 


20 atuA/ 109 : 


où u suit une loi normale réduite. En outre, les termes xf5}, de la série varia- 
tionnelle admettent la représentation asymptotique 


.{n u qg(1—9) 
xfn © rs V/ no? 


où x, est le quantile d'ordre g de P(x), c'est-à-dire P(x,) = q, p(x) est la 
densité de la fonction de répartition initiale. 


20.4.2. Fonction de répartition empirique. Nous avons introduit plus haut 
la fréquence empirique »,(x), nombre des valeurs empiriques inférieures à 
+, suivant une loi binomiale de paramètre P(x). 

| On appelle fonction de répartition empirique une fonction P, (x) défi- 
nie par 


EG = ©, (4.17) 


n 
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En d'autres termes, la fonction de répartition empirique est définie par la 
relation suivante : | 


0, x <= x 


EG) = a, xD < x ex, (4.18) 


1, x > x, 


Le graphe de la fonction de répartition empirique est une courbe en 
escalier dont les sauts, multiples de 1/7, ont lieu aux points définis par les 
termes de la série variationnelle xf = x$9 < ... «& x{*. La fonction de 
répartition empirique jouit de toutes les propriétés de la fonction de ré- 
partition. On l'appelle encore fonction de répartition de l'échantillon. 

Pour x fixe, l'espérance mathématique de P,,(x) est égale à P(x). Donc, 
Ja loi des grands nombres pour # >’ nous dit que pour tout x la fonction 
de répartition empirique converge stochastiquement vers la fonction de 
répartition théorique initiale P(x). Bien plus, on a le 

Théorème de Glivenko. Za fonction de répartition empirique P,(x) 
converge presque sûrement uniformément en x pour nc vers la fonction 
de répartition théorique P(x) : 


P { im sup |Æ(@-F(x)l = 0} = 1, 
A—+00 —00 LE< +00 

__ Pour mesure possible de l'écart de la fonction de répartition empirique 

P,, (x) par rapport à la fonction de répartition théorique P(x), x étant fixé, 

on peut utiliser le fait qu P, (x) — P(x) suit une loi normale de moyenne nulle 


| P(x) (1-— P(x)) | 
et de variance RS LS Mais une telle mesure de l'écart n'est 


pas uniforme en x. L'étude de la statistique de Kolmogorov 
D, _ sup LP,Gx)— P(x) 1. 


D <s<+00 


est très importante en statistique mathématique. 


Théorème de Kolmogorov. Si une fonction de répartition P(x) est conti- 
nue, alors 


lim P {Va sup LP,G)—P()1 < 2} = 


fn —+ 00 —D<3<to 


+ 
= K()= ÿ (A-)e##, z> 0. (4.19) 

&=-— © 
La fonction K(z) est tabulée (8]. La statistique D, est utilisée dans le 
test non paramétrique (cf. n° 20.3.4) de données empiriques concernant 
une hypothèse sur la fonction de répartition théorique de la variable aléa- 
toire parente. On remarquera que la fonction de répartition de la statistique 
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D, ne dépend pas de la forme de la fonction de répartition initiale continue 
P(x). 

Le calcul de la statistique D,, n’est pas compliqué, car l'écart de la 
fonction de répartition empirique par rapport à la fonction de répartition 
théorique continue est maximal aux points de discontinuité de P, (x), de 
sorte que . 


D,= max { ml _ pas }, Es PRE) } (4.20) 
I<n<n LL n 
ouencore 
D, max { A LL ] . } (4.21) 
PPT 2n 2n 


Dans les tests unilatéraux on peut se servir de la fonction de répartition 
des statistiques de Smirnov : 


DE = sup [P,(x)-P(x)] (4.22) 


Oz "| 
ou | 
Dx - inf [P,(x) - POI. (4.22’) 
mers > 


Ces statistiques ont la même fonction de répartition 


[nti->)] k k-1 
P{DI >= x)= P{DE = x) — > CEx (x 1) X 


10 
k n—k 
x(1-x-7) , Dex (4.23) 
Théorème de Smirnov. Si la fonction de répartition P(x) est continue, 
alors 
lim P{VnDt <z}- 1e", z<0. (4.24) 


On connaît aussi la fonction de répartition conjointe limite des statis- 
tiques Dit et D;. 
me. Si Ja fonction de répartition P(x) est continue, alurs 


22 1+2 e7 (ste)! Fe e °Uvtil-1)s) | e744-letis)! , 
2 À 


On connait aussi les représentations asymptotiques des lois des 
Statistiques D,, Dt et D. 
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20.5. Loi des caractéristiques empiriques 


On appelle caractéristiques empiriques les caractéristiques de la fonction 
de répartition empirique. 

Les caractéristiques empiriques sont des variables aléatoires, fonctions 
de valeurs empiriques, c'est-à-dire des statistiques de la forme 


SNS 


EUX das) = | 4) dP(). (5.1) 


— 


La fonction de répartition empirique P(x) servant d'estimation de la 
fonction de répartition initiale P(x) (cf. 20.5.2), on conçoit que les carac- 
téristiques empiriques puissent servir d'estimations des caractéristiques 
correspondantes de la fonction de répartition initiale. Ceci explique l’im- 
portance de l'étude des fonctions de répartition des statistiques empiriques 
et de leurs caractéristiques numériques. 

On conviendra dans la suite de désigner les caractéristiques numériques 
des statistiques empiriques (c'est-à-dire de la fonction de répartition em- 
pirique P(x)) par la même lettre que les caractéristiques numériques corres- 
pondantes de la population (c'est-à-dire de la fonction de répartition ini- 
tiale P(x)) mais surmontée d’une barre. 


20.5.1. Moments empiriques. La valeur moyenne de l’échantillon est définie 
par la relation : 


1e F 
s=— Qu J x dP(). (5.2) 


Les caractéristiques numériques de la moyenne se calculent facilement 
eu égard au fait que x est une somme de variables aléatoires indépendantes 
de même fonction de répartition. Par exemple 


EX=m; 


2 5.3 
Vs G:3) 
n 


où m1 est la moyenne, o* la variance de la population : 


m = S xdP(x), o= I] (x — mm)? dP(x). 


Il résulte immédiatement de la formule (5.3) que la moyenne empirique 
X converge stochastiquement vers la moyenne »7 de la population lorsque 
n oo, Bien plus, l'écart normé 4/7i (%*—n1) entre la moyenne empirique et 
l'espérance mathématique de cette moyenne suit une loi asymptotiquement 
normale de paramètres (0, ai). 
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La variance empirique est (généralement) définie par 


À jour. 2 
= } Qi. (5.4) 
Les principales caractéristiques numériques de la variance empirique sont 
de la forme 
E 5° — (1 +) u? ; 
n . 
Vars = MM 20m, 2m) , na 3mè 3m} 


n [20 OR 
où à »1, et à mn, correspondent les moments centrés d'ordre deux et quatre 
de la population, c'est-à-dire 
Ma = 0, Mi = (| (x—m)" dP(x\). 
De la première formule (5.5) il suit que la statistique 
n | ” 
m1 n-lri 


est un estimateur sans biais de la variance. 
De plus, l'écart normé 4/71 (5 —-a?) entre la variance empirique et la variance 
de la js suit une loi asymptotiquement normale de paramètres 
(O, m1, — mé). 

Les moments empiriques supérieurs (centrés) sont définis par 
_ . >, Eux), rz 2. (5.6) 


+ 


m, — 


Le calcul des caractéristiques numériques des moments empiriques d'ordre 
supérieur ne présente pas de difficultés. Il faut se servir de la relation évi- 
dente Ex; = a,= [| x" dP(x}et de l'indépendance des variables aléatoires 
1. Les expressions rigoureuses des caractéristiques numériques des mo- 
ments empiriques #7, pour r = 3 sont lourdes, mais leurs représentations 
asymptotiques sont bien plus simples : 


Em, = m,+0 () - (5.7) 
= I ' 1 
Var mi, = Los, — 2rm,_ im, mé + mani] +0 (+) . (5.8) 
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De même que les moments empiriques d'ordre un et deux, les moments 
m, d'ordre supérieur suivent une loi asymptotiquement normale (pour 
Næ+o) de moyenne et de variance définies par les termes principaux des 
formules (5.7) et (5.8). 


20.5.2. Fonctions de moments empiriques. Le théorème suivant est utile 
pour déterminer les caractéristiques numériques de fonctions de moments 
empiriques. 

Théorème. Soit donnée une fonction H(m,,m,) des moments empiriques 
mn, et M,, ne dépendant pas explicitement de n, et telle que : 

1) /a fonction H(u, v) est deux fois contintiment dérivable au voisinage 
des points m,et m, ; 

2) pour toutes les valeurs x,, k = 1, ..., n, la fonction H(m,,m,) = 
= H{(x;,, Xe, ..., Xa, n) est justiciable de l'estimation | H|\ < Cn, où C et p 
sont des constantes non négatives. 

Alors la moyenne et la variance de la variable aléatoire H{m,, m,) 
admettent les représentations asymptotiques : 


EH = H(m,,m,)+0 () : (5.9) 
_ OH : . 0H 
Var H = Var m, üm, Gn,, m,)+2E[(m,—2m,)(m,-m,)] Om, (m,, m,)X 
0H _- OH 1 
X Om, Gn,,m,)+ Var m, Om, Gn,, m,)+0 (- | ze) . (5.10) 


Le théorème cité est valable pour les fonctions d’un nombre quelcon- 
que d'arguments et dans le cas d'échantillons multidimensionnels. 

Si seule la première condition du théorème est réalisée, la statistique 
H(ñ,, m,) suit une loi asymptotiquement normale de moyenne et de variance 
définies par les termes principaux des formules (5.9) ct (5.10). On remarquera 
que le terme principal de la formule (5.10) peut être nul. Dans ce cas 
Yn(H—EAH) suit une loi asymptotiquement normale de variance nulle, 
c'est-à-dire converge stochastiquement vers zéro. Il n'est pas exclu que 


pour un p = 3 la quantité »7"(H—-EH) suive une loi limite non triviale 


qui n'est pas obligatoirement normale. 


20.5.3. Les lois rigoureuses des caractéristiques empiriques ne sont dis- 
ponibles que dans des cas exceptionnels. La plus complètement étudiée est 
la population normale. 

Si la fonction de répartition initiale P(x) des valeurs empiriques x, 
k=1,...,n, est fonction de répartition d’une loi normale de paramètres 


(nr, o°), la moyenne empirique X = _ D xs €t la variance empirique 5° 
&=1 


sont indépendantes et de plus X suit une loi normale de paramètres 
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(on D) ct _ s*’ une loi de 7?_, à #—1 degrés de liberté, autrement 


nl 
n— . 

de variables aléatoires indépendantes obéissant à une loi normale de 

paramètres (0, 4°). De plus, le rapport 


] 5? admet la même loi que la moyenne arithmétique de 7-1 carrés 


— 4/n-1 > - (5.11) 


suit une loi de Student (cf. chapitre 6) à #— 1 degrés de liberté. 


Chapitre 21 
ESTIMATION DES PARAMÈTRES 


21.1. Problème et propriétés de l'estimation 


21.1.1. Position du problème. Soit & une variable aléatoire à valeurs dans 
un cspace mesurable (X, #3). On admet qu'il est connu que la loi de la va- 
riable Ë£ appartient à une classe de lois {Ps, 0 € O} sur (X, 3), dépendant 
d’un paramètre 0. Cela signifie que dans l’ensemble ©, appelé ensemble des 
valeurs possibles du paramètre, il existe un 0, tel que la loi de £ est confon- 
due avec Ps,» c'est-à-dire P{È € 1"} = P:, (0), l'E B. La valeur 6, s'appelle 
valeur vraie du paramètre. On admet que la valeur vraie du paramètre est 
inconnue. Le problème consiste à estimer la valeur vraie du paramètre 0 à 
l'aide d'une suite indépendante de x observations (mesures) de la variable 
aléatoire £. A cette suite est associée une suite indépendante de variables aléa- 
toires (V1, Xe ..., N,) appelée échantillon de taille # (ou #-échantillon). 
L'échantillon cest un point d’un espace X” appelé espace des échantillons. 
L'estimation de la vraie valeur du paramètre 9 est construite sur le vu des 
observations v,, 2, ...,x,. Donc, l'estimateur 6° = 6°(x,,x2,...,x,) est 
unc fonction définie sur l’espace des échantillons X”, à valeurs sur l'ensemble 
©. En portant dans cette fonction les résultats des observations on obtient 
une valeur du paramètre 0° qui est prise pour estimation de la vraie valeur de 
0. Ces fonctions étant en nombre infni, il se pose un problème de préférence. 
La réponse n'est pas unique, car on peut définir plusieurs critères pour la 
qualité d'un estimateur. 


21.1.2. Principes de construction des estimateurs. Il est intuitif d'admettre 
que la qualité d'un estimateur /* dépend de la proximité d’une réalisation de 
0* de la vraie valeur du paramètre, le terme de proximité étant à préciser. 


Tout d'abord il existe plusieurs manières de définir la notion de proxi- 
mité dans l'ensemble ©. Par exemple, si © est un espace métrique, comme 
mesure de proximité de deux éléments 0, et 0., on peut prendre la distance 
deces éléments. D'une façon plus générale on peut introduire sur © une fonc- 
tion de perte r(0,, 0.), 0,, 0, € ©, c'est-à-dire une fonction non négative 
interprétée comme la perte que l'on subit si pour estimation du paramètre on 
prend la valeur 0, alors que la vraie valeur est 0,. Dans ce cas la réalisation 
de 0* est d'autant plus proche de 0 que la fonction de perte r(0, 0°) est petite. 

Ensuite, l'échantillon (x,, x2,..., x,) étant aléatoire, l'estimateur 
OX Nas. XX) est une variable aléatoire, donc la proximité doit être 
comprise dans un sens de moyenne. On peut par exemple convenir que 0* est 
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proche de / si sont petites les pertes moyennes : 


Esr(0, GX... Xh)) = 
= f ne j (0, 0x, ..., x,)) Padx) .….. Pofdx,). 
x x 


Mais pour cet estimateur 0°(x,, ...,v\,) ces pertes peuvent être petites pour 
certains 0 et assez grandes pour d'autres. Il est entendu que si l'on avait un 
estimatceur #°(x,,..., x,) tel que pour tout autre Uf(v,, ...,x,), 1€ 6, 


Eor(0, x va, N,)) << For, Ca Nas, ND), 


cet cstimateur serait à préférer à tout autre au sens de la mesure choisie. 
Mais, en général, un tel estimateur n'existe pas. Aussi, pour choisir un esti- 
mateur d’un paramètre inconnu doit-on faire intervenir d'autres considéra- 
tions. 

On peut par exemple choisir l'estimateur #°(x,, x, ..., x,) de sorte à 
minimiser la valeur de la fonction 


sup Egr(#, U°(xi, Ya .., X,)). 
0€6 


Ce principe s’appelle principe de minimax et les estimateurs correspondants, 
s'ils existent, estimateurs minimax. Dans cette approche on s'arrange pour 
minimiser la perte maximale entraînée par le choix de tel ou tel estimateur. 

Une autre approche du choix de l’estimateur est l'approche bayesienne : 
on admet que l’on a, à priori, des raisons de préférer telles valeurs du para- 
mètre 0 à d’autres. Autrement dit, on admet que sur l’espace © est donnée 
une loi à priori #(«4)). On choisit l'estimateur 0°(xv,, ..., x,) qui minimise 


l'intégrale 
(| Egr(0, MX Xe. N,)) Hd). 


6 


Il existe d’autres principes de construction des estimateurs. 


21.1.3. Inégalité de Cramer-Rao, Dans la suite nous supposerons que 
l'ensemble © est un intervalle de R! ou un domaine d’un espace euclidien 
R4 de dimension d. L'ensemble X sera généralement confondu avec R!. 

On dira que l'estimateur 0°(x,,x2. ...,.v,) est sans biais si 


En (ru va... x) = 0,  VNEO. 


Dans la classe des estimateurs sans biais il est intuitif d'admettre que le 
meilleur estimatcur est celui qui pour tous les Ÿ est concentré le plus près 
de la valeur moyenne, c'est-à-dire de 0. Si 0 est un paramètre à une dimen- 
sion, une mesure de cette concentration peut être la variance. On est donc 
amené à rechercher dans la classe des estimateurs sans biais l’estimateur 
OX, Nes ..., N,) qui minimise la fonction 


E(O ru ve NX) 0) pourtout  0CO. 


4x5 


Cette expression cst bornée inférieurement par une fonction de # de sorte 
que si la variance est minimisée par un estimateur #°(x,, x2, ...,x,) pour 
tous les 0, alors 0* sera l’estimateur cherché. 

Supposons que la loi P;{dx), 0 € 6, (0 est un paramètre à une dimen- 
sion) admet la densité p(0, x) par rapport à une mesure o-finie »(dx) sur 
(X, 3). En particulier, P;(dx) peut être une loi discrète concentrée aux 
points z1, 22, ... € X. De plus, les points z,, z+, ... ne dépendent pas de 0 
et de p{, masse (probabilité) correspondant au point z,, de sorte que 


> P(9, 2) 


Supposons d'autre part que les densités {4, x) sont dérivables par 
rapport à / el que pour tout ensemble mesurable /' de X 


l Op{U, X) 
" 5 frite x) r(dx) = | (dx). 


d' l' 
Posons 


Ib) = JE" log p{, 3 PO, N) dx), 0EO. 


La quantité 7() s'appelle quantité d'information sur le paramètre 0 conte- 
nue dans une seule observation. Dans le cas discret, 7(0) s'écrit sous la forme 


©. 0 log 74, z,)1° _ 
(0) > [— 71 4] P(0, 2). 


La quantité d'information sur 4 contenue dans l'échantillon (v,, ve, ...,1,) 
est égale à 7(0). 

Soit D°(x,, Xe, ...,X,) un estimateur arbitraire sans biais du paramètre 
0. Sous certaines conditions de régularité on a 


: DR œ———…—v. 
— 4) I ? (1.1) 


00°) - LD Cr ESTA ETES A) 


l'égalité étant réalisée si et seulement si 


log p(6, Xi) | …. rs 
ne FETE = A[O (x, ..., x) — 0] 
pour presque tous les x CR" par rapport à la mesure (0, x,) ... 
... PU, X,) v(dx,) ... v(4x,). Ici À ne dépend pas de x,,12, ...,xX,, mais 
par contre il peut dépendre de 0. 
Les conditions de régularité mentionnées consistent en la réalisation 
de l'égalité 
, 9 lo8 LU, Ness Ve) f [7 


on 00 L (dx) RE (/x,) — 0 


4K6 


où LU, x ...,X,) = PO, X,) PO, x)... PU, NX), et en la possibilité de 
dériver par rapport à / l'égalité 


f.. FO... xD LO, x, ..., x,)rGdxs) ... »(dx,) = 0. 
x > 


L'inégalité (1.1) s'appelle inégalité de Cramer-Rao et fournit la borne 
inférieure de la variance de l'estimateur sans biais. L'estimateur qui trans- 
forme l'inégalité (1.1) en égalité est dit efficace. Donc, parmi les estimateurs 
réguliers sans biais, les estimateurs eflicaces sont ceux qui possèdent une 
variance minimale. Appelons efficacité de l'estimateur 4°(x,, x, ...,x,) le 
rapport de la borne inférieure de la variance de l'estimateur à la variance 
réelle de l'estimateur 

ss 4 1 
Ro ni(0) oË(0°) 


Il est évident que 0 -= eff (4°) - 1. Deux estimateurs efficaces d'un même 
paramètre sont presque sûrement confondus pour tout 4. 


21.1.4. Estimatcurs exhaustifs, Désignons par Qu(dx,, dx, ...,dx,) une 
mesure sur (X*, %") définie par 


QAdx,. dx... dx.) = PAdx,) Pdxe) ... PdX,). 


L'estimateur U°(x,. xs, ...,1,)est dit exhaustif pour le paramètre / si la loi 
conditionnelle 


QuéA/N OX va ON) = 1 AC, 


ne dépend pas de /. L'estimateur 0°(x,,x2, ...,x,) est exhaustif si et seule- 
ment si la loi conditionnelle de tout autre estimateur par rapport à la con- 
dition D°(x,, x, ...,x,) = 1 ne dépend pas de 0. La proposition suivante 
nous fournit un critère d'exhaustivité sous réserve qu'existe la densité 
de probabilité. 

Théorème 1. Supposons que les mesures P{dx), 0 € ©, sont absolument 
continues par rapport à une mesure 0-finie (dx) définie sur (X,®) et soit 


d Psdx) 
HN) = —-—— 
PA, x) dy : 


estimateur OX Nas NX) Soit exhaustif pour le paramètre West que 
l'on ait la représentation 


PU, x) PO, x) PONS) = RO Rs Nas ee 0 No) MX 6 Nas 0 Na) 


Une condition nécessaire et suflisante pour qu'un 
q 


où g0°) et MX Na ...,N,) sont des fonctions mesurables non négatives, ge 
ne dépendant de X,, X:,..., X, que par l'intermédiaire de D°(xX,, x2,..., NX) 
et HOxX,, Na ..., X,) ne dépendant pas de 1). 

L'importance de l'exhaustivité d’un estimateur pour la théorie de 
l'estimation est soulignée par le théorème suivant. 


AK7 


Théorème 2. Soient (x, Ya, ..., X,) un estimateur exhaustif pour un 
paramètre 0, 0x3, Xe, ..., X,) Un estimateur quelconque sans biais du para- 
mètre 0. Alors pour tous les 0€ © 


EgL/ (Or Xe x) ON <s EgfOŸ (x Xe», x) — 07, 


où fr) = Ex Xe... , OX Xe. X9) = 1} (de ce qui précède il 
résulte que la fonction f(t) ne dépend pas de 0). En outre, la fonction 
f (0*x, Xe... X)) est aussi un estimateur sans biais du paramètre 0. 

Si donc l'on dispose pour le paramètre 0 d'un eitimateur sans biais 
quelconque U?(x,,x., ...,x,)et d'unestimateur exhaustif 0°(x,,x2, ...,x,) 
on peut construire un nouvel estimateur sans biais de 0, qui, pour tous les 
0, aura une variance inférieure à celle de l'eitimateur initial. 

L'eitimateur exhaustif 0°(x1, ve, ..., X,) est dit complet si la réalisa- 
tion de la relation Ey7(0%(x, x3, ..., x,)) = 0 pour une fonction 
PO Xi Xe -.., X,)) entraîne que 9(0%(x, x2, ..., x,)) = 0 presque 
sûrement pour la mesure QoV 0 € ©. Si 0x, Xe, ..., X,) est un estimateur 
biais complet pour 9, alors pour tout autre estimateur 0?(x,, x, ...,X,) 

efjona 


FO va Na A) UP > EAU (x Xe 2, Xe) — OP, 


c'est-à-dire que l'estimateur /°(x,, v<, ...,.\,) est efficace. 


21.1.5. Estimateurs de paramètres à plusieurs dimensions. Supposons que 
l'ensemble © des valeurs possibles du paramètre est un domaine (ouvert) 
d'un espace euclidien R2 de dimension d. L'estimateur 0*(x,,x., ...,x,)est 
alors un vecteur de dimension d. Comme dans le cas à une dimension, on 
cherche parmi les estimateurs sans biais ceux dont la loi est la plus con- 
centrée autour de la valeur moyenne. Dans le cas multidimensionnel, une 
mesure commode de cette concentration est l’ellipsoïde de dispersion. 

Soit £ un vecteur aléatoire d-dimensionnel de moyenne a et de matrice 
des moments d'ordre deux F-— [ull: a = Ef, v, = ESS, à, 7 = 
= 1,2,...,d, où £! est la i-ième composante du vecteur &. Soit S un 
ellipsoïde de R* centré en un point 4, tel que si l'on concentre en son 
intérieur une loi uniforme (c'est-à-dire de densité constante), alors cette 
loi aura pour moyenne le vecteur a et pour matrice des moments d'ordre 
deux la matrice J. Un tel ellipsoïde est dit ellipsoïde de dispersion. En 


dimension un, il se transforme en l'intervalle Ja—o 4/3, a+0 4/31, où aet 
a? sont respectivement l'espérance mathématique et la variance de £. Dans 
le cas général, l'équation de l’ellipsoïde de dispersion s'écrit 


(x - a), x-a) = d412, 


où l'est l'inverse de la matrice 1”, x le point courant de l'ellipsoïde, (, x) 
le produit scalaire sur R4, 

Supposons maintenant que {P, 0 € O} est une famille de lois dans 
(4, 8) de densité p(9, x) pour une mesure «-finie (dx) définie sur 3. Soit U 
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un paramètre de dimension d. Posons 


. 0] 0, : ô | (),\ 
à(0) = | Dos pO D CE LU A) a, x) vds), 


z 


où k,r = 1,2,..., d et désignons par /(9) la matrice d'éléments 5,,(0). 

La matrice 7(0) s'appelle matrice de l'information. Soit par ailleurs 

(x, Xp --., X,) Un estimateur sans biais de 0. Désignons par S,,.(0) l'el- 

lipsoïde de dispersion pour la loi du vecteur 0°(x,, x, ..., x,) pour la 

er Q:dx;, dx, ..., dx,) = p(, x,) p(B, x2) ... p(0, x,) (dx) 
. (dx,). 

L’analogue multidimensionnel de l'inégalité de Cramer-Rao dit que 
pour tout estimateur sans biais 0°(x,, x2, ...,x,) du paramètre 0, sous cer- 
taines conditions de régularité, l'ellipsoïde S,.(9) contient un cellipsoïde 
d'équation 

n({(0) (4-9), u—0) = d+2, (1.2) 


où u cest le nombre d'observations, u le point courant de l’ellipsoide (#4 € R*). 
Les deux ellipsoïdes sont confondus à la limite. L'’estimateur 0°(x,,x.,...,x,) 
est alors dit conjointement efficace. La matrice des moments d'ordre 
deux de l’estimateur conjointement efficace est confondue avec n7!171(0). 
On appelle efficacité de l’estimateur 0°(x,, x, ..., x,) le rapport du volume 
de l'ellipsoïde (1.2) à celui de l'ellipsoïde S,.(9). La notion d'estimateur 


exhaustif de même que les propriétés des estimateurs exhaustifs exprimées 
par les théorèmes 1 ct 2 s'étendent visiblement au cas multidimensionnel. 


21.1.6. Propriétés asymptotiques des estimateurs. Supposons que la taille 
n —+ co et intéressons-nous aux propriétés asymptotiques des estimateurs. 

L'estimateur 0°(x,,x2, ...,x,) du paramètre 9 converge en probabilité 
Si 0(xi, Na -.., X,) —> 0 stochastiquement pour # + , Ces estimateurs 
sont parfois dits faiblement convergents en probabilité à la différence des 
estimateurs fortement convergents en probabilité pour lesquels la conver- 
gence mentionnée cest presque sûre. 

A noter que les estimateurs efficaces n'existent pas toujours. Mais il 
cxiste souvent des estimateurs asymptotiquement efficaces. 

Appelons efficacité asymptotique de l'estimateur 0°(x,, x, ..., x,) 
la limite 

] 
SL nn. à _. 
col”) ALU 0 LS n1(0) o3(0°) ? 


si elle existe. Souvent 05(0°) + . pour # —+ œ et dans ces cas donc e,(9°) = 


= [c/(0)]7! existe. De toute évidence 0 = e,(0°) & 1. Si e,(0°) = 1, 
l'estimateur 0%(x,, x2, ..., x,) est dit asymptotiquement efficace. 
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21.2. Méthodes de construction des estimateurs 


21.2.1. Méthode des moments. Supposons qu'une variable aléatoire suit 
unc loi appartenant à unc famille {Py, 9 € O0}, où © est un domaine de R*. 
Supposons que les d premiers moments de la loi Ps existent et posons 


m,(0) == [ x'Po(dx), r=1,2,...,d. 
X 


est confondu avec R! ou est un ensemble dénombrable. Avec l'échantillon 
(Xi Nas ce X) de la variable aléatoire £, construisons les moments em- 
piriques 

I nm 

mn, = FUN XE, T = }, 2. ... d. 

NE 
La méthode des moments consiste à égaler les moments empiriques ct les 
moments théoriques. On obtient le système d'équations 


m,(0) = m,, r= LES û, 


en d inconnues /!, ,..., (M, Si ce système admet unc solution unique 
OSCN 5 Nos sc Na) = SO Me, Ma), r =: 1, ...,d, et si les fonctions 
f, sont continues, l’estimateur {9°, r = 1, 2,..., d} obtenu converge en 
probabilité pour le paramètre 0. Mais, d’une façon générale, les estimateurs 
de la méthode des moments ne sont pas eflicaces. 


21.2.2. Méthode du maximum de vraisemblance, Supposons qu'une famille 
de lois {P9,0 € ©} sur un espace mesurable (X,8) admet une densité de pro- 
babilité p(9, x) pour une mesure (dx) a-finie définie sur %. Si X est discret, 
PB, x) est la probabilité que £ = x à condition que la vraie valeur du para- 
mètre soit égale à #. Soit (x,, ..., v,) un n-échantillon de la variable aléa- 
toire £. D'après la méthode du maximum de vraisemblance, pour esti- 
matcur U°(x,, 42, ...,x,) du paramètre 0 on prend une fonction empirique 
qui maximise la fonction 


PO, x) PO, x). PO X,) = LOS Ni Nas cos Na) 


appelée fonction de vraisemblance. Si la fonction de vraisemblance prend sa 
valeur maximale pour 0 = /°(x,,.x2,...,N,), il en sera de même pour la 
fonction log Z(, x,,x., ...,x,). Il est souvent plus commode de se servir de 
la fonction log L. Les estimateurs obtenus par la méthode du maximum de 
vraisemblance s'appellent estimateurs du maximum de vraisemblance. 

Pour trouver les cstimatcurs du maximum de vraisemblance il faut ré- 
soudre l'équation (4 = 1,2, ..., d) 


0 log L(0, x, Xe, ..., Xh) 

00? 
si 0 = (01, @,..., 0%). Ces équations sont appelées équations de vraisem- 
blance. En les résolvant il faut rejcter les solutions de la forme 0 = const ct 
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= 0, 


ne considérer que celles qui dépendent de x,,.v., ..., 4, et qui sont con- 
tenues dans le domaine de valeurs possibles du paramètre 0. II convient 
aussi de ne pas perdre de vue que la fonction de vraisemblance peut prendre 
sa valeur maximale sur la frontière du domaine ©. 

Les estimateurs du maximum de vraisemblance jouissent des deux 
propriétés importantes suivantes : 

A) Si le paramètre 0 admet un cstimateur exhaustif 0°(x,, x, ...,x,), 
alors toute solution de l'équation de vraisemblance est fonction de 
Li À SUR SEPT TRS 1 | 

B) Si le paramètre 0 admet un estimateur cfficace (resp. conjointement 
cflicace dans le cas multidimensionnel) 6°(x,, x., ...,x,), alors l'équation 
de vraisemblance admet une solution unique 0°(x,, x, ..., X,). 


21.2.3. Comportement asymptutique des estimateurs du maximum de 
vraisemblance. Soient © un intervalle de R!', X# = R! ct r(dx) = dx, où 
dx est la mesure de Lebesgue de R!'. Formulons un théorème qui montre que 
lcs estimateurs du maximum de vraisemblance possèdent de nombreuses 
bonnes propriétés pour n -» co. 
Théorème 1. Supposons que la densité p{0, x) vérifie les conditions : 
1) les dérivées 


©" log P(, x) 


Rae = 1,2,3 
o0* 9 k Ï 9 , » 
existent pour tout 0 CO, pour presque tous les X ; 
2) les inégalités 
Op(0, x) 7. O‘p{0, x) He O'p(U, x) _,. 
an |. Gix), ge = GX), 9 | G{x), 


ont lieu pour tout UE ©, G(x) et GX) étant des fonctions intégrables sur 
R' par rapport à la mesure de Lehesgue et 


sup ( G.{x) P{u, 1) dx < ©» : 
90 A! 


3) l'intégrale 
cr D N)1E 
I(0) — [° Li 1 PO, x) dx 
R 


est finie et positive pour tout 0€ ©. 
Alors l'équation de vraisemblance admet une solution OX, Nas. Na) 
qui est un estimateur asymptotiquement efficace convergent en probabilité ct 


asymptoliquement normal du paramètre 0. (La quantité 
1) V mU%(x, Xas ces Xx) — 0) 


est asymplotiquement normale de paramètres (0, ?) si la vraie valeur du para- 
mètre est égale à 0). 
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Ce théorème est valable pour le cas d'une variable aléatoire discrète, 
de même que pour un paramètre / à plusicurs dimensions. 


21.2.4, Méthode du minimum du 7°. Soit (x, x, ...,x,) un #-échantillon 
d'une variable aléatoire £ à valeurs dans (X, X) dont la loi appartient à 
unc famille {P5, 9 € @}). Supposons que l'espace X est partagé en r ensembles 
mesurables disjoints X,, X., ..., X,. Désignons par n, le nombre de réa- 
lisations de l'échantillon (x,, x, ...,\,) appartenant à l'ensemble X.. 
Si l'ensemble X est fini, c'est-à-dire si la variable aléatoire £ ne prend qu'un 
nombre fini de valeurs, on peut admettre que X, est un ensemble à un point. 
Donc, on a cffectué un groupement des résultats des observations. 
Formons la quantité 


._ + (a, — up(9) 
: À AU) ' 


où p,(0) = PA), à =. 1,2,...,r, NEO. L'estimateur M°(x,, Na, ..., NX) 
s'appelle estimateur de la méthode du minimum du 7° s'il est obtenu par 
minimisation sur / de 7°. Si 9 est un paramètre d-dimensionnel, pour ob- 
tenir un cstimateur par la méthode du minimum du 7° il faut résoudre le 
système d'équations 


[TR Cu npAN TT OP) D 12 y 
À PO) 2np}(0) on ' PT 


Les estimateurs obtenus par la méthode du minimum du 7° s'apparentent 
beaucoup aux estimateurs du maximum de vraisemblance par leurs proprié- 
tés asymptotiques. Par exemple, sous certaines conditions les équations cor- 
respondantes n'admettent qu'une seule racine convergente en probabilité 
qui réalise le minimum absolu de 7°. 


21.3. Régions de confiance 


21.3.1. Notion de région de confiance. 11 est quelquefois important non 
seulement d'estimer un paramètre inconnu d'une loi, mais d'indiquer la 
région où doit éventuellement être situéc sa vraie valeur. Cette région qui 
est construite sur le vu des observations peut varier d'un échantillon à l'autre, 
c'est donc une région aléatoire. On peut par conséquent parler de la proba- 
bilité que cette région recouvre la vraie valeur du paramètre. Prenons un 
nombre € == 0 assez petit et proposons-nous d'établir une règle qui mettecn 
correspondance les résultats des observations et une région de l’ensemble 
paramétrique qui contient la vraie valeur du paramètre avec une probabilité 
1—e. Cela veut dire que dans une longue suite de réalisations de l'échan- 
tillon on ne commet une erreur que dans 1006 % des cas. 

La région mentionnée s'appelle région de confiance, le nombre 1 — € 
coefficient de confiance. 
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21.3.2. Construction des régions de confiance. Soient (x,, x, ..., x.) un 
n-échantillon d’une variable aléatoire Ë, dont la loi dépend d'un paramètre 
inconnu à valeurs dans l'espace R', 0%(x,, x2, ...,x,) un cestimateur de 
0. Désignons par gs(dt) la loi de l'estimateur 0° sachant que la vraic valeur 
du paramètre est confondue avec 0, c'est-à-dire que 


gdi) = Q6{0*(x 1 Xe ..., x) € dt}, 
où Qs(dx;, dxe, ..., dx,) est une loi définie sur l’espace À" par la formule 
Qcdx,;, dx:, ... dx,) — P;(dx,) P(dx:) …. Ps(dx,). 


Si la loi gy(dt) ne possède pas d’atomes, on peut toujours pour un € > 0 
donné exhiber des nombres a,(9, €) et a,(9, €) tels que a,(9, €) < a,(0, €) et 


Î œG@n+  [  qtdr)=e. 


(t<a,(8,e)} (> 0,10, e)} 


Il est entendu que ce choix n'est pas unique. Supposons que ces fonctions 
peuvent être choisies continues en 0 et que chacune des équations a,(0, s) = 
= 1,i=1,2,1€ 0, admette une solution unique c(f, 8), i = 1, 2. Alors 
les relations 

Qc{a,(0, €) < 0° < a,(0, €)} = 1-6 


et 
Qofc,(0°, €) < 0 < cA(0°, e)} = |—-Ee 


sont équivalentes. 

Par conséquent, si l’on connaît la loi de l’estimateur 0°(x;,, x2, ...,x,) 
on peut, pour un € => O donné, construire l'intervalle de confiance 
[c,(0®, €), c(0°, €)] à 1 —e. 

On remarquera que si la loi gs{dt) possède des atomes, les nombres 
a,(9, €) et a,(0, s) doivent être choisis à partir de l’inégalité 


qdi)+ [  ad)=<e, 


{1 <a,(0, e)} {1 = 6,10, 81} 


puisque dans ce cas il peut ne pas exister de a, et a, qui réalisent l'égalité 
correspondante. En poursuivant cette construction comme plus haut, on 
obtient un intervalle de confiance dont le coefficient de confiance est in- 
férieur à 1 —&. 

Il est évident que des estimateurs 0° différents fournissent des inter- 
valles de confiance différents. Il est souhaitable que la longueur de l'inter- 
valle de confiance soit la plus petite possible. Si donc l’on a à construire 
des intervalles de confiance, on aura intérêt à partir d'estimateurs efficaces 
ou asymptotiquement efficaces obtenus, par exemple, par la méthode du 
maximum de vraisemblance. 


21.3.3. Une méthode de construction des intervalles de confiance. Supposons 
que la loi P;{dx) ne possède pas d'atomes et qu'il existe une fonction 
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8, X,, Na ..., Ne), 0€ O, XX... V, € R1 possédant les propriétés 
suivantes : 

1) g(0, x, Xe ..., X,) est continue ct monotone en 0 ; 

2) la fonction Qu{g(0, x, X2, ..., XX) < &} ne dépend pas de ! pour 
tous les « € R! (voir la définition de la mesure Q) au n° 21.3.2). 

Pour & = 0 donné, choisissons des nombres a,(s) et a.(e) tels que 


Qa{a,(e) < gg, x, Na ..., X,) < d(E)} = 1 — €. 


: Lis la condition 2) les nombres a,(e) et a,(e) ne dépendent pas 
ce 


Désignons par c, i = 1,2, les nombres qui vérifient la relation 
ECis Xi Xas + Xn) = Aie), à = 1, 2. Les nombres c, ne dépendent que de 
Vo Xe ce.) NA €t de €. Il est immédiat de voir que 


Qc, <0<c:}=1-Ee, 


donc {c;, c.] est un intervalle de confiance à 1 —- €. 
Posons 


F{x) = [ Pod»), xeR!, 


— 


et supposons que #4 est continue et monotonc en /. Alors, il est immédiat 
de vérifier que la fonction 


Ex) Fox) .… Fix) 


remplit les conditions 1) et 2), donc on peut l'utiliser pour construire un 
intervalle de confiance. Ceci étant, puisque 


O0 pour a=0; 
QFolxs) < x) = { « pour 0O<a<l; 
1 pour «=>, 


DJ 
en raison de la continuité de F;(x) en x, la somme À log F4(\,) suit une 
=! 


loi gamma 
—loe, 
Li] 1 ; L 
Q{ — log a; < 2 log Fé(x) < —-log a} = TD" le”! dt. 
-bge, 


Pour € = 0 donné, on peut choisir les nombres a, et 4,, 4, < a, tels 
que l'intégrale de droite soit égale à 1 —-e. D'où il vient 


Q Gi <= IL RG) < à = Î|—e. 
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n 
La fonction JT] F5(x3) étant continue et monotone en 0, il existe des c, et 
k=!1 
ca dépendant seulement de e et de x1,x2, ...,x,, tels que [c;, c.] est un 
intervalle de confiance pour 0 à 1 —-e. 

Si la fonction g(0, x,,v2, ..., x,) Satisfait la condition 2), est continue 
en 0, mais n'est pas nécessairement monotone, alors au lieu d’un intervalle 
de confiance on obtient une région de confiance. Ce même principe peut 
être utilisé pour la construction des régions de confiance dans le cas où 0 
est un paramètre à plusieurs dimensions. 


21.3.4. Méthode de Bayes. La méthode de construction des intervalles 
de confiance, qui utilise la formule de Bayes, part de l'hypothèse que le 
paramètre 0 est aléatoire aussi. On admet aussi par ailleurs qu'est connue 
la loi à priori de 0. Désignons par g{0) la densité de cette loi par rapport 
à la mesure de Lebesgue (on rappelle que © est un intervalle de R!). 

Soit d'autre part 0°(x,, x2, ..., x.) un estimateur du paramètre 0 
construit à l’aide de l'échantillon (x,, x, ...,x,) de la variable aléatoire &. 
Supposons que la loi g;(dt) de l'estimateur 0° (cf. n° 21.3.2) est aussi absolu- 
ment continue pour la mesure de Lebesgue et admet pour densité g(0, ?). 
D'après la formule de Bayes la densité de probabilité de 0 pour 0° fixe est 


pe — #00) 08) 
Dre Î (0, 0°) g(0) d0 
(S) 


Donc la probabilité conditionnelle que le paramètre 0 soit compris entre 
c, et ca, Sachant que 0° est fixe, est 


P{c, < 0 < c,/0*} = f y(1/0°) dt. 


| 


A présent nous pouvons pour € > 0 donné déterminer des nombres 
c.,(0°, e) et c.(0°, €) tels que 


P{c,(0°, €) < 0 < c.(0*, e)} = 1—e. 


Nous obtenons donc pour 0 un intervalle de confiance à 1 —&. 

Cette méthode n'est pas toujours commode, car nous n'avons pas 
toujours de raisons de supposer que le paramètre est aléatoire, ou s'il 
l'était, que sa loi à priori est connue. 


Chapitre 22 


ESTIMATION DES PARAMÈTRES 
DE CERTAINES LOIS 


22.1. Estimation des paramètres 
de la loi normale 


22.1.1. Estimation de la moyenne, la variance étant connue. Soient 
Cris Xe... X,) Un n-échantillon d'une variable aléatoire normale Ë de 
densité 
| _(æ- 6» 
r(9, x) = e 4%, xeR!, 


1/20 


où 0 cest un paramètre inconnu, # connu. Posons 


1 Li 
OX 5 Nas cs NX) = NZ — 
n =! 
Manifestement 0* suit une loi normale de paramètres E4#° = 0 ct 


g° . . 
E;([0° —- 0}? = . L'estimateur 9° est donc sans biais et convergent cn 


probabilité. 


Par ailleurs, comme /(0) = _ , le second membre de l'inégalité de 


2 
0 : ; He à 
Cramer-Rao vaut rÈ Ce qui exprime que l'estimateur 0* ‘est efficace. 


V/n(0°—0) 
[44 


68 > 0 trouvons (dans une table par exemple) un nombre c, tel que 


Es | e ? dx = 1-8. 


La variable aléatoire suit la loi normale réduite. Pour 


On obtient ensuite 


d'où 
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Ici Quid ..., dx,) = (2ro?) ? exp {> È Ga 09°} dx, ...dx,, 


donc [o- fe a, 0°+ Re d est un intervalle de confiance à 1 — €. 
\/n 4/1 


22.1.2. Estimation de la variance, l'espérance mathématique étant connue. 


Dans ce cas : 
p(8, x) = de exp re | x E R!, 


4/219 29 


où 0 € ]0, [ est un paramètre inconnu et a connu. Le paramètre 0 admettra 
pour estimateur sans biais efficace 


| Ci] 
0x, Xor cos Xa) = 7 À (xx — a}, 
OÙ (Vs Vas: NA) CSt un z-échantillon. La variance de 0° cst 
,. 203 
Es(0° — 0)° = FS $ 
n0° 


La quantité ET suit une loi du 7° à # degrés de liberté. Pour construire 


un intervalle de confiance à 1 —e nous choisissons des nombres a, et a; 
(dans une table) tels que 


Qs{a < me < a) = Î|—e, 


où 
Qudx;, dx:, ..., dx,) = 
_ Qr0) T exp {— ) (x — a}!} dx, dx dx 
. 20,2, °* ROSE DT 
Alors 


$ L 
donc ee | est l'intervalle cherché. 
as &i 
22.1.3. Estimation de la variance, l’espérance mathématique étant inconnue. 
Le problème est le même que dans le n° 22.1.2 sauf que le paramètre a 
n'est pas connu. Le paramètre 0 admettra pour estimateur sans biais 
convergent en probabilité : 


OX Xe +5 Xe) = 


n—]1 


ÿ Ca—x)!, n> l, 
&=] 
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ko! 
2 
° ° 2 done 
Éo("— 0) n—1" 
La quantité 4 . suit une loi du y° à #— 1 degrés de liberté. L’intervalle 


de confiance se A comme au n° 22.1.2. 


22.1.4. Estimation de l'espérance mathématique, la variance étant inconnue. 
Ce problème est le même qu'au n° 22.1.1, sauf que le paramètre a est incon- 
nu. L'estimateur 0° = # est encore sans ‘biais et convergent en probabilité. 
Pour construire 1 intervalle de confiance, on se sert du fait que la quantité 


 … où 5° = — r > (x:—%)°, suit une loi de Student à n—1 degrés de 


k= 
liberté. La densité de Celle loi est 


En déterminant c, à partir de la relation 
à 
2 f S, ax) dx = 1—Ee, 
0 


on obtient 


YX--0 
Qn ce es É ce} = Î-Ee, 


AY 


où Qudx,, dx, ..., dx,) =: (20°) "8 exp {5 y (0) }x 
km 


1 
Xdxidx....dx,. Donc, l'intervalle [*—sc,, X+sc,] est un intervalle de 
confiance à 1—e# pour le paramètre #. 


22.1.5. Estimation conjointe de la moyenne et de la variance. Supposons 


que les paramètres a et o d'une loi normale sont inconnues. En résolvant 
l'équation de la vraisemblance, on obtient 


d = ca > M=X, (vo) = is > (x -X)? = 51. 
1 N'x1 
Cependant l'estimateur (a*)° est avec biais. Posons b*° — es LL Alors 
(a*, b*) est un estimateur sans biais pour le couple de paramètres (a, 0). 
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L'équation de l'ellipse optimale (cf. n° 21.1.5) cst 


CE Con 


a 20 n° 


Celle de l'ellipse de dispersion pour l'estimateur (a°, b*) est 


(u—a} .n—1 (vo!) 
D +— 


+ 
= 
L'efficacité conjointe de l’estimateur (a°, b°) est égale à — I , donc (a°, b*) 


est asymptotiquement conjointement efficace. Les quantités a° et b° sont 
indépendantes. 


22.2. Estimation des paramètres des lois binomiale et de Poisson 
22.2.1. Loi binomiale. Supposons qu'une variable aléatoire £ prend les 
valeurs 0,1,2,... avec les probabilités p,(0) = C£04(1—-0)"-#, 


k=0,1,2,...,N respectivement, le paramètre 0, 0 <— 0 < 1, étant 
inconnu. Soit (k,, &2, ..., K,) un n-échantillon de la variable &. Posons 


| n 
O°(k:, Ka .. k,) un nN À ki. 


Alors 0° est un estimateur sans biais du paramètre 0 tel que 


O(1 — 0) 
+ _f}\? — 
E;(0° — 0) IN 
D'autre part il est immédiat que 
N 
O = GG -0 


D'où il suit que 0° cest un estimateur efficace du paramètre 0. 
Pour construire un intervalle de confiance on utilise le fait que la 
4/nN(0* —0) 


quantité suit une loi asymptotiquement normale réduite. Si 


l'on admet approximativement que 


4/nN(0°— 0) | 2 | _ 
— SE e = ——— d 
@e| [A ET) a e ! 
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et si l'on tire «4, de 


on obtient approximativement 


Qf-e < VNn(O° — 0) < a = |—Ee, 
V0(1-06) 


où Qs cest définie par 
Q{k: ka ….., k,) Lo Pa,0) Pi, (0) ….. Pi,(0), k, Te 0, 1, 2, ..) N. 


Donc, les bornes de l'intervalle de confiance à 1 -e sont les racines du 
trinôme du second degré 


(Nn+ a)x3 — (2Nn0* + aë)x + Nnf*° = 0. 
Si, en particulier, on fait N = 1 dans le schéma considéré, on constate 


que la i-ième valeur de l'échantillon de la variable parente & est l'apparition 
ou la non-apparition de l'événement 4 = {£ = 1}. La probabilité de cet 


y . . 
événement est égale à 0. Ce paramètre admet 0° = . pour estimateur, où 
v est le nombre d'observations qui ont donné lieu à l'événement À. 


22.2.2, Lui de Poisson. Soit £ une variable de Poisson. La variable £ peut 
donc prendre les valeurs 0, 1, 2, ... avec les probabilités p,(9) = Ti er, 


0O<"M<,0E€]0, f{ étant un paramètre inconnu. 
Le paramètre 0 admet pour estimateur sans biais 
1 LC] 
N° = — 
n > ki, 


où (k1, La ..., k,) cst un échantillon de la variable &, De plus 


Comme /(0) = 0”, l'estimateur 0° est efficace. D'autre part, 


ne. 
7 0°-0) 


suit unc loi asymptotiquement normale réduite. Donc, pour les grands 
on a l'égalité approchéc 


ou -« < /: (0° —1)) < a) = | —6, 


où a, est choisi comme au n° 22.1, ct la mesure Q; définie par 
ghittst ee +kn 

HET Ki 
Li° 2 .... n° 


D'où il résulte que les bornes de l'intervalle de confiance à 1—e sont les 
racines du trinôme du second degré 


Qi, LES DR) ne k, = 0, 1, 2, .… 


LT pe 
x? (or F2 tr + 0° =: 0. 


On rappelle qu'ici, de même qu'au n° 22.2.1, l'intervalle de confiance 
cst construit approximativement mais que l'erreur tend vers 0 lorsque 


I -» ©, 
22.3. Estimation des paramètres de la loi uniforme ct de la loi gamma 
22.3.1. Loi uniforme sur un intervalle à une extrémité fixe. Soit 


(Vi, Xa, ..., X,) un échantillon d’une variable aléatoire £ suivant une loi 
uniforme sur l'intervalle [0, 0], 9 étant un paramètre inconnu. Posons 


N$ = max «,. Îl est immédiat que l’estimateur x$ est exhaustif pour le 
1<tæ<n 
paramètre / ct que la fonction de vraisemblance 
I 


-_ si max 1,<0, \,=0; 
L(0, ANT Vas ... N,) —- 0" (| <& d < Li] : ’ 


O dans les autres cas 
prend sa valeur maximale pour 0 = x%. Mais l’estimateur x$ est avec biais. 
Un cstimateur sans biais cst 
nt] 


[7 Le un on x*. 
n °” 


En outre /* est l'estimateur sans biais dont la variance 


E;(0° — 0)° = _ 
n(r1+ 2) 


est la plus petite. 
Désignons par Qofdx,, dx, ...,dx,) une mesure sur R" dont la densité 
par rapport à la mesure de Lebesgue est égale à Z(9, x,, xa, ..., x,). On 


SOI 


Lo 
remarquera que la loi de _ est indépendante de 0 : 
(4) pour a<«0; 
an \" I 
0° eee nes 
Of < a = (5) POLRMRE Le. 5 F | : 
1 pour «= lt! : 


Pour & = 0 donné, choisissons a, tel que 
0° , an \" 
Ie QT = a) 1- (55) | 
d'où a, = lye Donc 


x* 
of: <0< = 1e, 
VE 


$ 
e. » e ,. À e . e. 
c'est-à-dire que l'intervalle Le %_} cst intervalle de confiance à 1 --E€. 


ÿel 
22.3.2. Loi uniforme sur un intervalle d’extrémités inconnues. Si unc variable 
aléatoire £ suit une loi uniforme sur un intervalle [9,, 0.], 0, et 0, étant des 
paramètres inconnus (0 = 0, < ,), alors ces paramètres admettront 


respectivement pour estimatcurs sans biais de variance minimale les 
cstimateurs 


02 — — —— 
2 n—-1 n-1° 
oùx? = min x\,,x\$ — max x\,. Les estimateurs 
1<t#n 1<Ek<n 
.$ + 
ge - "TM, 
2 
n+]1 
CH 7 Ce Gé xt) 


n— 


sont respectivement des estimateurs sans biais de variance minimale pour 


0,+0; 


le point médian et pour l’étenduc 0, — 9. La loi conjointe de x? et 
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x® est déterminéc par la densité 
SN xs) = AG D) (3x) 2 (0 — 0), 


où D, = Ny ei Ne Wa. 


22.3.3. Estimation du paramètre d'échelle dans la lui gamma. Supposons 
qu'une variable aléatoire £ suive la loi gamma 


< 


— —— 


xl-ie 0 
Pda) = À ot dx pour x>0; 
0 pour x<«<0, 
le paramètre 0€ ]0, œ[ étant inconnu, 7€ ]0, { un paramètre connu. 
On remarquera que pour À = 1 cette loi se transforme en la loi exponen- 
ticlle 


pq) J 0e S dx pour x:0; 
0 pour x= 0, 


Soit (vi Ve -.., X,) un #-échantillon de la variable £. Le paramètre 
0 admet pour estimateur efficace l'estimateur 


| Li 
(1° = A2. D AT 


* #21 
et de plus 
(° 
Eg{0— 0 = -.. 
“el ) nÀ 
| s .…. NA0 ; , 
On notera par ailleurs que la loi de la quantité - - 0 cst aussi une loi 


gamma indépendante de W : 


y" le ? 
of" < x} -|] l'O 2) dy pour ve 0; 


pour x < 0, 
où la mesure QAd\,, dx. ..., dx,) sur R" cest définie par 
Q:dx;, dx ... dx,) — 


z£ 
re ©, 0, k=1,2 
_ —— dx pour x 0, =; 2 540: 
kml Tr) ; : 
0 dans le cas contraire. 
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Donc, en trouvant les nombres a, ct a, à partir de la relation 


L 
Qofa+nà < Le < st na} = l-e, 


è $ 
nn n?9 | à 1 


on détermine l'intervalle de confiance Ë +a,;' nya 


22.3.4. Estimation de la moyenne de la lol gamma. Supposons encore que 
la variable £ suit une loi gamma 


x-le-z 
AIN r x >=0; 
Padx) =) TE) PTS 
0 pour x<o0, 


0 étant un paramètre inconnu, 0 < # — . Par un calcul immédiat on 
trouve 


d d log I (0) 
10) = — 
La méthode des moments nous conduit à l'estimateur 0$ = — x» NH 


OÙ (Xi Ya -.., X,) est un n-échantillon de la variable aléatoire & $. “On a 
Es0? = 0 et Eç(0? — 0)? — ©. L'efficacité de l'estimateur 0? est définic par 


1 
8) — _ ses 
= dE — 


de sorte qu'elle est indépendante de ret toujours inférieure à l'unité. L'équa- 
tion de la vraisemblance s'écrit 


1 Ç dog T(0) _ 
En x log x; ee PTE 10; 


L'unique racine positive de cette équation définit l’estimateur du maximum 
de vraisemblance 0*. Cet estimateur est asymptotiquement efficace et suit 


d log _ us . 


une loi asymptotiquement normale de paramètres (0. [n— 


Chapitre 23 
MÉTHODE DES MOINDRES CARRÉS 


23.1. Estimateurs de la méthode des moindres carrés 


23.1.1. Principe des moindres carrés. Supposons qu’un #-échantillon d’un 
paramètre inconnu 0 = (0,, 0,, ...,0,) dont on sait qu'il peut prendre 
ses valeurs dans un domaine © d'un espace R° de dimension "1, se repré- 
sente sous la forme 

Ja = (0, €) ; 


Y'a = J1(0, €3) ; (1.1) 


Pa — JO, En), 


où /,(0, &,) sont des fonctions connues au paramètre 0 près, €, les erreurs 
(le bruit) de la £-ième valeur de l'échantillon. On admet que l'espérance 
mathématique du vecteur e = (£1, ..., e,)’ des erreurs d'observation est 
nulle : Ee = O0, ce qui revient à admettre l'absence d'erreurs systématiques 
d'observation. 

En statistique mathématique, on appelle méthode des moindres carrés 
une méthode d'estimation ponctuelle reposant sur le principe des moindres 
carrés suivant : pour estimation du paramètre inconnu © dans (1.1) on 
prend la valeur Ô qui minimise la somme des carrés : 


s(0) = > LA, 6)}, (1.2) 
c'est-à-dire 
> Di-AG a) = min À (-/0, e)F. (1.3) 
=! 0€80 &t=1 


L'estimateur Ü minimisant la somme de carrés s(0) s'appelle estimateur 
de la méthode des moindres carrés où MMC-estimateur du paramètre 0. 

La méthode des moindres carrés est largement utilisée cn tant que 
méthode d'estimation ponctuelle pour le traitement des résultats des mesu- 
res, en analyse régressive, planification des expériences, économétrie, etc 

Contrairement à la méthode du maximum de vraisemblance par 
exemple, la méthode des moindres carrés n'implique pas une information à 
priori sur la forme de la loi des variables aléatoires €,, k = 1,2, ...,n. 
Mais dans un modèle aussi général que (1.1), les MMC-estimateurs du 
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paramètre ne possèdent aucune bonne propriété optimale sauf si sr, sont 
des variables normales. 


23.1.2. Modèle linéaire général. Il existe un cas important où les 
MMC-estimateurs possèdent, même pour des échantillons de petite 
taille, des propriétés d'optimalité se traduisant par une absence de biais 
ct par une variance minimale. C'est le modèle linéaire où 0 — R",m —< net 


DIE TUE STE DERRSS EUTELES QUE 
Va Na EN et EN enfln LE2 3 (1.4) 
Va Vai0  AUPS .. Van Er 


ou matriciellement 
v — AUtr, (1.5) 


où } = (Jp des +. D) est un échantillon, X = {xs i= 1,...,n,j = 
= 1,...,m,m —< n}, la matrice des coefficients connus, 4 = (0,,0,,...,0,)" 
le vecteur colonne des paramètres inconnus à estimer, & = (6,,F2,...,F,) 
le vecteur colonne des erreurs aléatoires. 

On admet généralement que Es = 0 et Ce) = Efer’] = 0°7, où u° est 
la variance (inconnue) des variables aléatoires €,, & :- 1, ..., 1, non corré- 
lées de même fonction de répartition, car si Efee”] — 42}, où F est une 


…! 


matrice inconnue, alors le changement 6 - F7 ©, vo = D x, eo = 
1 


= V e donne Efrose] = 01. 
L'estimation du paramètre // dans (1.5) d'après la méthode des moin- 
dres carrés consiste à déterminer le vecteur / minimisant la somme de carrés 


(0) — ÿ [À x] 2 Qu V0) Os 0)". (1.6) 
1 si 


23.1.3. MMC-estimateurs dans le modèle linéaire non dégénéré. Supposons 
que det X’X Z 0 dans le modèle linéaire (1.5). Un tel modèle est dit non 
dégénéré. | 

Le MMC-estimateur / du paramètre / est solution de système 
d'équations normales 


X'XÙ — X'y, (1.7) 


c'est-à-dire 
D (MON, (1.8) 


de plus Ef -: 4, E(0--0) (0-0) — &{N'X)T*, 
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L'estimateur 


I S : I CI | sn 2 
= ROAD @-x0 = ET pr Ÿ x] (1.9) 


est un estimateur sans biais pour 0°. 


23.1.4. Mesures directes. Les résultats des mesures itératives indépendantes 
se représentent sous la forme 


= 046, i= 1... 


où Ü est la grandeur mesurée, €, les erreurs de mesure. Pour le cas considéré, 
la matrice X du modèle linéaire (1.5) est un vecteur colonne unité. Si 
Var #, = 0°, on parle alors de mesures directes d’égale précision. 

7 Le MMC-estimateur Ô pour les mesures directes d'égale précision est de 
a forme 


” 1 0 
Ü—--Y'y, Varô=—. | 
: à Vis r à (1 10) 
Les estimateurs sans biais de la variance a? sont de la forme 


s° = > CO: —_ 0): 


n—1 


D 2 7 
Si Var €, = — , où p, sont connus et généralement distincts, on parle de 


& 
mesures directes de précision inégale, 
Le MMC-cstimateur Ü pour les mesures directes de précision inégale 
sont de la forme 


= ——, (1.11) 


de plus 


one ) PO — OP. (1.12) 


@-1 À ps 
&=1 


23.1.5. MMC-estimateurs dans le modèle linéaire dégénéré. Si le modèle 
linéaire (1.5) est dégénéré, c'est-à-dire det X’X = 0, alors il est plus commo- 
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de de définir les MMC-estimateurs en termes de matrices pseudo-inverses 
ou matrices inverses généralisées. 
Soit ZZ une mXm — matrice projective définie de façon unique par 


les égalités 
IIX'X = X'XII=0; II? = II. 


On appelle pseudo-inverse (ou inverse généralisée) de la matrice X’X 
la matrice (X'’X)-9 définie par 


CA) = (AA ED) — II. (1.13) 


Si det X’X % 0, alors /1 =: 0 et par suite (X’#)" = (XX)! c'est-à-dire 
que dans ce cas la matrice pseudo-inverse est confondue avec la matrice 
inverse. 

Dans le cas d'un modèle linéaire dégénéré, la méthode des moindres 
carrés définit un sous-espace de vecteurs sur lequel est réalisé le minimum 
de la somme de carrés (1.6), minimum qui est de la forme 


(XX) X'y + [Th (1.14) 


où h est un vecteur arbitraire de R*. Pour cette raison, ce n'est pas le 
paramètre 0 qui est estimé dans le modèle linéaire dégénéré, mais une 
certaiac fonction linéaire B0 de ce paramètre, où B = {b4,i = 1,...,k, 
Ï = 1,...,m} est une KXm — matrice définie, # un nombre arbitraire fixé. 
La fonction linéaire 80 du paramètre est dite fonction à estimer si 
BII = 0. Les MMC-estimateurs B0 de la fonction B0 sont de la forme 


BÜ = B(X'XY70 X'y, (1.15) 
et de plus EBÜ = BD, E(BÜ - B0](BÜ— BAY = o?B(X'XY-V B'. 
Les cstimateurs sans biais de u* sont de la forme 
s — . GX 0) Gy— X0) — _ > [ 2 A , (6 
où ÔŸ = (X’X) 0 X''v, rest le rang de la matrice X’X. 
Si 2,0 et BR. sont deux fonctions à estimer, alors 
Cov (8,0, B,0) = a°B(X'XY70 B:. (1.17) 


23.1.6. Modèles linéaires avec paramètres aléatoires. Considérons le 
modèle linéaire 


= X0 +6, (1.18) 
Où } = (J'y da ..., V,) est un n-échantillon, X = {xy, 1 = 1, ..., n, 
J = À 352 ,m) la matrice des coefficients connus, # = (,, 0., ..., D) 


un vecteur aléatoire inconnu d'espérance mathématique EN = «a et de 
matrice des covariances E(0— a) (9—a) = Ce = (64, ...,e,)" le vecteur 
des erreurs indépendant de 9, Es -: 0, Ere” :- u*1. 
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L'estimation du vecteur inconnu Ÿ par la méthode des moindres carrés 
consiste à déterminer une fonction linéaire Ÿ de l'échantillon qui minimise 
l'espérance mathématique de la variable aléatoire 


n m 3 
5(0) = (y—X0) (y — X0) = > | He xw)| (1.19) 


Si le vecteur a des espérances mathématiques du paramètre U est connu, 
alors | 
OU = (1-LX)a+Ly, (1.20) 


où L=CX'(o’1+XCX') , et de plus EÙ = a, E(Ü—0)(Ü—-40) = 
= C-CX'(at+XCX') ! XC. 
Si le vecteur a est inconnu, alors 


Ü = (X'X) ! X'y, (1.21) 


et de plus E[0— 0] (0—0]° = o{X’X)"! et le MMC-cstimateur du paramètre 
aléatoire 0 est le même que pour un paramètre déterministe. 

Ceci est valable même si det X’X = 0. Il est entendu qu'ici, de même 
que dans le cas déterministe, il convient de considérer des fonctions linéai- 
res du paramètre 0, et, au lieu de (X’X)"!, se servir de la matrice 
pseudo-inverse (X’XY7?. 


23.1.7. Propriétés des MMC-estimateurs. Dans le modèle linéaire général 
y = X0+te, Ee=0, Cove =ul, de X’X # 0 (1.22) 


les MMC-estimateurs Ô possèdent les propriétés suivantes : 
a) Oest sans biais. 


b) Si lim 1 (X’X) est une matrice non dégénéréc, alors Ü est 
B —# CO 

SRE en probabilité et le vecteur \/n(ô—0), asymptotiquement 

normal. 

c) Théorème de Gauss-Markov. Le MMC-estimateur possède une 
variance minimale dans la classe de tous les estimateurs linéaires sans biais 
du paramètre 0 et de plus Ô et y — XÔ ne sont pas corrélés. 

Dans le modèle linéaire le MMC-estimateur Ü ne possède pas en 
général la plus petite variance dans la classe des estimateurs sans biais. 

Si, dans (1.22), le vecteur € suit une loi normale, le MMC-estimateur 
Ô de 6 possède, outre a), b) et c), les propriétés suivantes : 

d) 0 est un estimateur par la méthode du maximum de vraisemblance. 

e) 0 possède la plus petite variance dans la classe des estimateurs 
sans biais de 0. 

f) Ô suit une loi normale d'espérance mathématique 0 et de matrice 
des covariances d{X’X)"!. 
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g) La variable aléatoire 


Les 00 — 0, " _ À Ê = > TA 


suit une loi de 7? à #7 —m degrés de liberté. 
h) Les estimateurs 0 et s° =: E (G--X0) Gr X4) sont exhaustifs 


pour Ü et u*. 
i) Üet y— XÜ sont indépendants. 


23.2. Modèles linéaires de régression 


23.2.1. Ajustement des données. Dans les applications de la statistique on 
a souvent à estimer le caractère de la corrélation entre les variables statisti- 
ques observées, par exemple entre les paramètres de processus technologi- 
ques et la production finie, entre la luminosité des étoiles et leurs dimensions, 
entre la quantité de précipitations tombées sur un secteur donné et la 
production agricole de ce secteur, etc. 

Le problème fondamental est d'ajuster les données empiriques sur 
des courbes spécialement choisies appelées courbes ou surfaces de régres- 
sion caractérisant plus ou moins heureusement la corrélation entre les 
variables observées. 

Soient 7 et £ deux variables aléatoires (généralement dépendantes). 

Définition. Les fonctions 


fux)= EE = x], gen) = El£/n = »] 


sont appelées respectivement régressions (théoriques) de 7 en & et de £ en 7. 

Si l’on considère la régression de 7 en &, par exemple, la variable aléa- 
toire & est supposée indépendante et appelée variable de régression. 

La régression possède les propriétés suivantes d’'optimalité : les quanti- 
tés Efn—g(é)}? et Ef£-wy(7)}? atteignent leur minimum respectivement 
pour g{x) = f(x) et pÜy) = gem0). — | | 

Pour régressions théoriques des estimations statistiques on choisit 
en principe des fonctions dépendant linéairement des paramètres inconnus 
à estimer. Pour ce faire on recourt souvent à des échelles fonctionnelles. 

Les fonctions les plus fréquemment utilisées en analyse statistique 
sont : 


4 = 09+0,% ; 
4 = 00 +0,x + .….. +0,x* . 
y = 00+0,1n x ; 
| 
} —= 0o+ 0x +03; 
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I 
ù + 0x 
— 1 0 
PE D+hx+... +0! 
In y = 0,+0,x; 
In y = 0,40, 1n x. 


) 


23.2.2. Estimation des paramètres de régression linéaire. Soit x, la valeur 
de la variable de régression, y, la valeur de la variable dépendante pendant 
la i-ième observation, à == 1, ..., n. 1.e modèle linéaire de régression peut 
être représenté sous la forme 


P(»:) DE r(0, Xi) + Frs i 7 I, ...s 0, (2.1) 


où p(y) et r(0, x) sont des fonctions préférables pour la description d’une 
relation statistique entre la variable de régression et la variable dépendante, 
r(0, x) étant linéaire en 0 = (0,,...,0,.)’, &, des variables aléatoires non 
corrélées d’espérances mathématiques nulles. 

Par la méthode des moindres carrés on peut obtenir un estimateur du 
vecteur 0 = (0,, ..., 0,)" dans (2.1) minimisant la somme de carrés 


s(#) — ù LP) r(0, xD. (2.2) 


Le modèle de régression (2.1) est un cas particulier du modèle linéaire 
non dégénéré y = X0+e, det X’X %# 0. Par conséquent, si la matrice des 
covariances Ere’ = o?/, alors le MMC-cstimateur 4 de 0 dans r(9, x) est 
solution du système d'équations normales A7 X,0 — X/r, ct par suite 


Ü— (XX) Xer,, (2.3) 


où y, = (PO), PU2), ..…., PO). La fonction y - p”'(r{(0, x)) décrit une 
courbe de régression statistique ou empirique. 

Exemple 1. Régression linéaire simple. Soient mr) :: 1, r(0, x) = 
= ,-+0,x. Alors 


1 nv, 

x, = L ve UN (:): 
..... 0, 
1 x, 


n Yai- 2 xY 


Lx Ln-bx Lx 


n D x? (Ex) 


si 


La courbe de régression est 
y = ô, +Ox. 


Exemple 2. Régression polynomiale. Soient p(y) = y, r(0, x) = 
= 0,+04x+08x1+ ... +0,x"71 Alors 


1 6 NP ere 0, 
x = l'A Mar ar 0: 
L Ms (528 


Le MMC-estimateur Ü est solution du système d'équations normales 


n Vu JA 5) ô, D 


DA A ee | EE ES Es 
Dar-t Dar Dapt….. Date) 6,7 ar, 


La courbe de régression empirique est 
p = O0, +0x+05x2+ ... + rm, 


Exemple 3. Régression exponentielle. Soient p{(y) = In y, 
r(8, x) = 0, +0:x. Alors 


In y, 1 x, 
= In y: ”_ l Xe _ (7) 
CDS PS E A =... , o = (?:). 
In y, 1 x, 
n Yxinyp-)x jiny 
| "24-Œx) 


ÿ x} ÿ ny-5 Xi > xs in yi 
n Da-(Dx) 
La courbe de régression empirique est 
y = e +0ex 


23.2.3. Régression polynomiale. L'usage pratique de la régression polynomia- 
le présente un grave défaut : l'accroissement du degré du polynôme d'ajus- 
tement nécessite la reprise de tous les calculs. 
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Dans ce cas il n'est pas sans intérèt d'utiliser les polynômes orthogo- 
naux de Tchébychev. Au lieu d'estimer le paramètre 0 = (0,, ..., 9,.) 
dans le modèle 


Vs = Oi+0axi+ 0axf +... HOT + E 
on estime le paramètre «x = (a,,a,,...,&, ,)’ dans le modèle 
Ve = CoPo(Ni) + Pa x is) +. + 1e NI) + Fi (2.4) 


où g.(x) sont des polynômes de degré À possédant la propriété d'orthogona- 
lité suivante : 


Z Palxn) gx) = 0, k x I. 


Le modèle (2.4) s'écrit matriciellement 
y = Pate, (2.5) 
où 
P=pui=1,...,n, j=0,...,m—1}, y = px). 
Le MMC-estimateur de « est de la forme 
& = (D'P)-1@y, (2.6) 


c'est-à-dire . 
Ë A QNIT 
à, — —— Ts 


> giCvo) 


Le calcul des polynômes orthogonaux de Tchébychev y,(x) se fait à l’aide 
des formules 


Pr) = À, Peux) = TE ; K=—=0,...,m—2, (2.7) 


où 


tsl {=i (mi 
# L n L 3 
.2 +1 
2 V; AT: x .. Li 
E, = {=1 2 À =1 , 


Se. 000 000 000000000000 0 0 € 
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E, (x) = {= mil : {sl , 
)) d ) xt, > xt 
{=1 L {m1 
1 x .xtti 
ou à l’aide des relations de récurrence 
Potx) = 1, 
À Xi Pa - (x) D Xi Pol x) 
PQ) = Xp) — = — px). (2.8) 
> GE-1(x5) D qi(x:) 
| : m] 
Exemple 4. 
det n 2 
RE: sir 
LJ | A _ 
n 2 XV 2, À] 
d t m n CL) 
1 dE À, *i À # _ — 
x = x D Ci xt D x} 
PO) Ge, 
n x > (xx)! # 
det| : me 
X, x} 
=1 =! 
où 
e 1 2 
A — — AD 


Chapitre 24 
STATISTIQUE DES PROCESSUS ALÉATOIRES 


24.1. Tests entre hypothèses 


Quand on réalise un test entre hypothèses on observe la trajectoire d'un 
processus aléatoire x(#), 1 € [0, T]; entre plusieurs hypothèses concernant 
des lois finidimensionnelles il faut en choisir une sur le vu de la trajectoire 
observée. On sait comment résoudre le problème de test entre deux hypothè- 
ses. Une application importante de ce problème est la mise en évidence 
d'un signal sur un bruit de fond. Par exemple, une information reçue, on 
demande d'établir la présence ou l'absence d’un signal utile sur un bruit de 
fond aléatoire. 


24.1.1, Enoncé général du problème de test entre deux hypothèses con- 
cernant la loi d’un processus aléatoire. On observe la trajectoire d'un 
processus aléatoire x(#), 1 € [0, T] dont on sait à priori qu’elle appartient 
nécessairement à un espace de fonctions Fo, r) définies sur [0, T] (par 
exemple, l'espace des fonctions continues ou l'espace des fonctions sans 
discontinuités de seconde espèce, etc). Nous disposons de deux hypothèses 
H,(i = 1,2) concernant le processus aléatoire. D'après l'hypothèse A, la 
mesure correspondant au processus dans l’espace Fo, #, est la mesure y, 
(cette mesure est définie sur la tribu engendrée par les ensembles cyliadri- 
ques, cf. chapitre 9). On demande de choisir une de ces hypothèses sur le 
vu des observations. 

Soit R une règle qui nous fait prendre l'une des deux hypothèses. La 
forme la plus générale de cette règle est : pour toute trajectoire possible x: ) 
doit être définie une probabilité p(x(-)) CP est une fonctionnelle mesurable 
de cette trajectoire) d'accepter l'hypothèse /7,, si l'on observe la trajectoire 
x(), 1—p(x()) est la probabilité d'accepter l'hypothèse Æ,. Une telle 
règle est caractérisée par les risques «;, = P(H,/F,) d'accepter l'hypothèse 
H, si H, est fausse et «;, = P(H,/H,) d'accepter l'hypothèse Æ, si H, 
est vraie. Les expressions de «;, et &«,, sont données par les formules 


IPOOTACHE 
f (-p(x0))) mx). 

Il est naturel de chercher des règles qui minimisent les deux risques. 
On verra plus loin qu'il est possible de se borner à des règles non randomi- 


sées pour lesquelles p{x(:)) ne prend que les valeurs 0 ou 1. Alors Fo, r) est 
33° 515 


As 


Œsi 


divisé en deux parties : G,et G: = Fo. r1- Ga ; Six(-)€E G,, on prend H,, 
si x(:) € G, on prend /7,. Les risques sont donnés par la formule 


dy = (] u(G) GG j). 


24.1.2. Absolue continuité des mesures sur les espaces fonctionnels. L'absolue 
continuité ou la singularité des mesures rattachées aux processus étudiés 
sont très importantes dans la résolution des problèmes de statistique. 
Soient For, un espace fixé, %[0, 7 ] la tribu de parties de cet espace 
engendrée par les ensembles cylindriques, y, et 1, des mesures sur (0, T] 
rattachées à des processus aléatoires (ou à un même processus pour des 
hypothèses différentes). Les mesures 7, et #, sont deux à deux singulières 
(orthogonalcs) si existent des ensembles disjoints G,€ %[0, T] tels que 
t(Gs) = H:(G3) = 0. La mesure y, est absolument continue par rapport à 
la mesure y, si ,(C) = 0 pour tous les C € Y[0, T] tels que u,(C) = 0. 
Dans ce cas il existe une fonction o(x(:)) #[0, T]-mesurable telle que 
pour tous les C € (0, T] 


:(C) = [eG) 74 A). (1.1) 
0 


La fonction p{x(-)) est dite densité de la mesure 4, par rapport à la mesure 
a. Si se, est aussi absolument continue par rapport à y#,, alors les mesures 
met z, sont dites équivalentes. Ceci aura lieu si et seulement si la fonction 
e(x(-)) de (1.1) est presque partout positive par rapport à y,. Auquel cas 


mC)= [7 #0 (1.2) 


y 


Pour toutes mesures (finies) y, et 4 on peut exhiber des ensembles 
deux à deux disjoints 4,, 4, et «i tels que ,(42) = u2(4,) = 0 et que ces 
mesures soient équivalentes sur 4, c'est-à-dire il existe une fonction mesu- 
rable o(x(-)) définie sur 4 telle que pour tous les C 


H(CNnAd= Î eûx) mdx) ; 

cnA (1.3) 
HCNnA)= | ex). 

cNA 


24.1.3. Le test de Neyman-Pearson nous fournit une procédure de choix 
entre hypothèses telle que &., soit minimal pour &;,, = €(0 < & < 1). La 
procédure proposée est dans un certain sens optimale. En effet, soit donnée 
une procédure de risques &,. et &,. On peut construire à l'aide du test de 
Neyman-Pearson une procédure telle que «,, <= &,, et que «,, soit minimal 
(donc œe, = Go). 

Décrivons un test en fonction des propriétés de l’absolue continuité 
mutuelle des mesures y, et y, rattachées au processus observé pour les 
hypothèses H, et H,. 
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a. Supposons que les mesures y, et ye, sont orthogonales. On peut alors 
exhiber un ensemble G, tel que #,(G,) = 1, n2(G,) = 0. Si x(-)€G,, on 
accepte l'hypothèse #,, si x(-) € G., l'hypothèse /7.. Les risques sont 

&ys = Ha(G1) = 0, 
Les = HaCFo, r3— 1) = 1 —p,(G,) = 0. 
Donc, dans ce cas, le test considéré peut être de ee nuls. 


b. Supposons que y, et y sont équivalentes, p(x(-)) est la densité de 
lt, Par rapport à y, o(x(-)) = 0 pour presque tous les x(-) pour #,. Soit 


Ra = {x() 2 e(xC)) < 4}; La = (NC): ox) = 2). 
Supposons que À satisfait à la relation 


H:(R) =  H:(RU 1)>Ee. 


Un tel À existe pour € € ]0, 1[, puisque #,(R2) croit de 0 à 1 si À croit de 
0 à . On distinguera trois cas : ° 
1) H2(R;) = €. Prenons G;, = R;, G: = For Gi. N vient 


Mis = HMa(Ry) = €, ui = Ha (Fo, r3— Ga) = 1—7(R;) , 


2) H1(Rj)<e, H:(R UT) =e Alors G, = RU ls Gs = 
= For] Gi ae, Qu = 1-/0(R;)-4(15) ; 

3) p2(R;)<e, H:(R U15)=e. On peut alors construire la 
procédure randomisée suivante définie par la fonctionnelle de probabili- 


té p{x(-)) : 


P(xC)) = 1 si x\x(-)ER;j; 
P(x(:)) = 0 si x(-)€ Fo, n-ÀR;-1l° - 
{x(e)) = RS si ax()El. 

:(T; 


On remarquera que si la mesure #, est continue (donc s,), c'est-à-dire qu'il 
n'existe pas de trajectoires possédant une probabilité positive, alors dans 
le cas 3) on peut construire aussi une procédure non randomisée : il existe 
un DC l'; tel que n:(D) = e—y,(R;). En posant G, = RU D, G; = 
= Fo, r— R;-— D, on obtient un test pour lequel «;, — & et «3, est minimal, 
c. Dans le cas général, on peut indiquer des :!,, 1, et /! tels que soient 

réalisées les égalités (1.3) et p,(1,) = Ch) = 0. Soit 

Riz {xC) ES : o(xC)) < AJU1, ; 

1 = {xC) € 4: ox()) = A}. 
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Sie 1 —-/y:(4,), alor en prenant G, = AU, G, == 4, on aura 
dir = Ha(HUA) = 1—yp2(ds) & 8, 
azy = H(4ls) = 0. 


Si e < 1—-yu,(4,), on choisit À tel que HR) & 6, HARUT,) > € ct on 
procède exactement comme dans le cas b. 

Donc, pour construire le meilleur test de Ncyman-Pearson, il faut 
savoir construire les ensembles . 1, sur lesquels sont concentrées les mesures 
mutuellement singulières, et si ces mesures sont absolument continues, la 
densité de l’une par rapport à l’autre, de même qu'il faut connaître la loi de 
e(x(-)) pour l'une et l'autre hypothèse. 


24.2. Test entre hypothèses pour processus 
à accroissements indépendants 


24.2.1. Notations fondanwntales. Soit x(1) la trajectoire observée d'un 
processus, définie sur {[0, TT], x(1)€ R', x(+) € Do, rp Où Do, r, est l'espace 
des fonctions sans discontinuités de seconde espèce. D'après l'hypothèse 
J1,(kK = 1, 2) le processus x(r) est un processus stochastiquement continu à 
Rene vie indépendants dont la fonction caractéristique est définie par 
la formule 


À I : 
Eexp {izx(4)} :- exp {iz3: (4) — 2 b,(t)2° 1: 


n J (er 7 PO mu) I1,(, 4x)} ; (2.1) 


x 


où les fonctions Z2,(1, À) sont continues et non décroissantes pour tous les 
boréliens À situés à une distance positive de 0, ;, (+) des fonctions continues, 
72(0) = b,(0) = Z1,(0, 4) = 0 (c'est-à-dire qu'on admet que x(0) = 0 sinon 
on considère la fonction x(9-—x1(0)). Introduisons sur les boréliens de 
[0, T]x R! les mesures : 
n(B)=  [ dl, dx). 
Ut, mn CA 

Supposons d'autre part que 1,,1,,et 1 sont des ensembles disjoints sur 
les mesures 7, et 7, sont équivalentes sur  : il existe une fonction mesurable 
positive /'(#, x) telle que 


(ANR) [SG NA GIXAN) ; 


A(12 
a(ANB) :: (| SG Na xXdx). 
ANA 
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Définissons la mesure empirique des sauts : 
V.)(B) LE ÿ 428, x(1+0)—x(1—0)) (2.2) 
# 


(ce processus ne possédant pas de discontinuités de seconde espèce, cette 
quantité est finie pour tous les 2 tels que BN{[0, T]X]-r,e[} — ©). On 
désignera par y, la mesure rattachée au processus x(s) sur Dio, #, pour l'hy- 
pothèse /7,. 


24.2.2. Conditions d'orthogonalité. Test d'hypothèse de risques nuls. Les 
mesures /4, Ct 7, Sont orthogonales si l’une au moins des conditions suivan- 
tes est satisfaite : 


D m(1,)+73(43) = + oo ; 
2) pour un c € ]0, I1[ 


TG, x): 11 S(s, x) 1 > c} = © ! 


Lt *(s, x) 


4) br) Æ b.() (pour un 1€ (0, T)) ; 
S) la fonction ;'(4) =: y,(1)—y,(1)--a,(r), où 


3) J CSG, sx) = 0: 
A 


at) — J : AUTO dy)—11.(, dy)] (2.3) 


est définie si seulement 


" (—/(s, NY = 
] EG sx dx) ©, 


A 


soit n’est pas absolument continue par rapport à b(r), soit 


f ( dy) ) db) _— (2.4) 


dit) 


où b,(4) = b,(r) = b(r) pour tous les # € (0, T]. 

Indiquons des tests de risques nuls pour chacun de ces cas. 

la) Soit 7,(1,) = +. Désignons par G, l'ensemble des x(°) € Do, 
tels que »,4.,(41) = 0. Si x(-) € G,, on prend l'hypothèse /J,, si x(+) € G,, 
on prend F,. 

1b) Soit 7:(42) = +4. Désignons par G, l'ensemble des x(°) € Dior) 
tels que v,4.,(.12) =- 0. Si x(-) € G:, on prend FH, , sinon F7,. 
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2a) Soit x,{(s, x) : J'(s, x) > 1+c} = +00. Considérons une suite 
croissante d’ensembles mesurables 2, telle que 7,(2,) > n, f(s,x) > 1+c 
pour (s, x) € B,. Désignons par G, l'ensemble des x(:) tels que 


1 
2 EXT) ve) (B,) — I. 
Si x(°) € G,, on prend //,, sinon /Z,. 
2b) Soit 7,((s, x) : J'(s, x) <= 1—c) = +. Choisissons une suite 


croissante d'ensembles mesurables Z, telle que 7,(8,) — n, fs, x) < 1-c 
pour (s, x) € Z,. On construit l ensemble G, exactement comme dans le cas 
3) Considérons une suite de partitions 4 — (J Fn, telle que les 
£ =] 


quantités 
a (26) -0(0,)), 
PORCEETTATETA 


vérifient la relation À, 071 <c. Alors on accepte /Z, si 


a(V,,)-7(F, 
Ce NET 


sinon /1;. 
4) Supposons que 


j (1— J(s, x)Ÿ°  < 
JG (sx dx) <ce, 


4 


as(t) étant défini par (2.3). Considérons le processus 
1 
(4) = x()— J» PG@sxdy Des mn (dsxd»)| 


(l'intégrale est comprise comme la limite de l'intégrale étendue au domaine 
(0, TIX{y:1y1 > €} pour s& } 0). Le processus x°() est un processus con- 
tinu à accroissements indépendants d'espérance mathématique y,(#) pour 
H,, Y2()+a,(t) pour FH. et de variance b, (+) pour FH,. Supposons que #, est 
tel que b, (1) < b;(re). On admettra que les fonctions b, (r) sont strictement 
croissantes. Examinons deux cas. 

4a) Supposons que b,(#.) < (1—0)b,(t,) pour un à — 0. Alors pour 


Chaque n on peut choisir des points 14, < fi << lus < 18s < ..., tels que 
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CUIR COA MIE ba(es D) bit) > 0. Prenons G, égal à l'en- 
semble des x(-°) pour lesquels 
, 1 € 1 


en BG) NOT à CO EE TOR EECTON) EST 


4b) Supposons que b2(10) < (1—0)b,(#,) pour un à > 0. Choisissons les 
points LA < ln) <a sl... tels que (1-0) [b, " tx) —bi(t À m)] = 
> btn)-bÂtu) > 0. Désignons par is l'ensemble des x(-) pour lesquels 


re 


ci  . 
im 2 EE). 5 ans [x° (re) 
— Nr) Yates) + eff) — Gt) +a(tu)f = 1 


Dans chacun de ces cas on accepte l'hypothèse 77, si x(°) € G, ou l'autre 
hypothèse si x(-) 4 G 

S) Si yt) n'est pas absolument continue par rapport à b(t), on peut 
choisir une suite de partitions de l'intervalle [0, T] :0 = #,o0 < li <= ... < 
< fnm, = T telle que les quantités 


0 = ny D) 
SL OP à TE) 


vérifient l'inégalité 9, -- # pour un x > 0. Désignons par G, l'ensemble 
des x(-) pour lesquels 


: 1 ÇA SA) = (ta) 4 ] 
nn 0 È RTE) : 
XL) — b(re- 1)] = 0. 


On accepte l'hypothèse Æ, si x(:)€ G, ct FH, dans le cas contraire. 


24.2.3. Conditions de mesures, Soient remplies les conditions : 
I. A, ,UA, = 
(1 = A > 


LR EVE = 1(dsX dx) < mo, 


A 
LL. br) = b,(t) = br). 


IV. La fonction y(#) est absolument continue par rapport à b(s) ct 


r 
j (42) a 
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Alors les mesures se, et 7, sont équivalentes et la densité de sr, par rapport à 
ICSUreS 71, CU fl 2 1 2 
st, cst exprinée par la formule 


ee dy) \° 


4. f In /(s, fr.) GsXdy)-x,(ds +: dy)] + 
[fun <e 


“ ( In J(s, »)r,., (dsXdy)+ 


[- femme 


| J [in J(s,»)— / 5,3) 1 17 (ds X dy) + 


l-sumnl=e 


+ ] (1 JG, »))ri ds x a (2.5) 
[faune I 
(les intégrales de (2.5) sont des intégrales stochastiques). 


Définissons la loi de probabilité de @{ ie D à l'aide de la fonction ca- 
ractéristique de In e(x(:)). Pour l'hypothèse // 


Ecxp {iz In @{x(-))} — exp L-, 2° l ( ah ] dhr)t 


+ Île Jen 1 —iz(f (5,5) 1)]r(dsXdy)+ sn : 


LA 
. | f/d 
OU, ] (6) dis). Vour l'hypothèse 77, 
T ! é 
Eexp {iz In e{x(- ))} = CxP = 1] (5 ] db{t) t 


+[ [ere 1 52 sf »=1 m:(dsXdy)+izass, 
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où 


oo OR. 
CPE -, [Sn d'b(r) ! | (27e DA 76, a) a, (ds X dy). 


24.2.4. Cas général. 11 est évident que si »,4,,(4,0J.1,) = 0 on peut presque 
sûrement choisir //, pour à tel que »,4.,(1,) = 0 (v,.,(1,) et »,,.,(42) ne 
peuvent pas être simultanément nulles). Si »,4.,(1,J 4) == 0, alors la loi de 
x(-) est confondue avec celle du processus à accroissements indépendants 
x*(t) dont la fonction caractéristique pour l'hypothèse 7, est de la forme 


. 1 à 1zy 
de Fee Pal : 29 _ 1 LE 
exp {ir (4)z 5 b,() 2° 1 Ï[ ( 11 Li 


(s = s)1 1.1 


] mdsxXdy)}, 


où 
(4) 2= 3) E | Dre. an (ds X dy). 
(-.1)N4Ax : 

Les mesures y£ rattachées au processus x°(-) dans Do. r, pour l'hypothèse 
H, seront équivalentes, ceci étant la densité p{x(-)) de la mesure y? par 
rapport à 75 est définie par la formule (2.5), si on y remplace 7,(B) par 
75 (B) = 7,(80.1). Donc, si sur le vu des observations, on ne peut choisir 
presque sûrement une hypothèse, on peut utiliser les résultats du numéro 
précédent pour construire le meilleur test. 


24.2.5. Définition du paramètre d’un processus homogène de Poisson. 
Soit x(1) une fonction en escalier dont les sauts sont égaux à 1, x(0) = 0. 
L'hypothèse F7, consiste en ce que x(#) cest un processus de Poisson de para- 
mètre À,(k = 1, 2). Donc, pour AH, 


)» 
P{x() = n) :- eh. 


La mesure correspondante 7, (ds5<dx) s'écrit 
nds X R) : AidsyatU), où BE R!. 
Donc, les mesures 72, sont équivalentes et 


e(xC-)) = (5) ax 


Il est évident que le domaine p{x(:)) < À est confondu avec le domaine 
In 
X(T) < À-A:+ 


. Donc, le test pour lequel x,, = e ct æ:, est 
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minimal se construit comme suit. Désignons par 7% un nombre tel que 
k , t 
; es e7Tl EE << . y CR ef 
<As , Ar ‘ 
ÿ = 0) . Si x(T)< nr, on prend l'hypothèse /77,, si x(T)>n,, 
<0 
l'hypothèse 77.. Si x(T) = n,, on prend l'hypothèse 77. avec la probabilité 


É y TX. n] (rar 4) à 
L<ns k! le ! 


ct l'hypothèse 77, avec la probabilité 
Up —1 
Pen] en" 
Æns Ù 


n, ! 


24.2.6. Définition de la moyenne d’un processus wienéricn homogène. Soit 
X(9) un processus continu qui est wicnérien de moyenne 0 et de variance 
pour 7, et de moyenne y et de variance # pour 77,. Les mesures y«, ct yes 
sont équivalentes et 


ext) = exp {yat À T}. 
Il est évident que le domaine &(x(-)) — À est de la forme 


PL 
In À ! 5 T 


—————— 


AT) = - 


y 


(on admet que y :- 0). x(T) suit une loi normale de moyenne Oct de variance 
T pour H, et de moyenne yT ct de variance T pour #,. Supposons que 
c(e) satisfait la relation 


ct soit À = «(e) VT 4 yT. On acceptera FH, si x(T) < Act H, si x(T) 22 à. 
Ceci étant, 


œ 
An = —— ( e”“1? du. 
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24.3, Test entre hypothèses pour processus 
de diffusion 


24.3.1. Définition de l’opérateur de diffusion. Soit x{(#), 2 € [0, T], la trajec- 
toire d’un processus de diffusion dans R". Pour l'hypothèse A, le vecteur 
de transfert du processus de diffusion sera a,(r, x) et l'opérateur de diffusion 
B,(t, x). On admettra que les fonctions a,(f, x), B,(, x) sont définies et 
continues pour {€ [0, T], xE R". On remarquera que si l’on connaît la 
trajectoire du processus x(#) on peut définir B,(+, x(r)), 1 € [0, T], si l'hypo- 
thèse 7, est vraie. On peut le faire de la manière suivante. Pour z€ R”, 


posons 
M,9= lim (* es ) = e ) | +) (3.1) 


nn — © KE 0 


(+, -) est le produit scalaire dans R"). La limite (3.1) existe presque sûrement 
que À, ou 7, soit vraie. Alors 


! 


AG, 2) = [ (Bis, x(s))z, 2) ds, (3.2) 


0 
si est vraie H,. 
Si, sur la trajectoire observée, pour un € [0, T] et un zER", on a 
! 


f (B,(s, xs) 2), z)ds # fe, (s, x(s)) z, z) ds 


(les intégrants étant continus, ceci aura lieu si (B,(r, x(t))z, z) # 
# (B(1, x())z, z)) pour un 1 € [0, T] et z € R") l'égalité (3.2) ne peut être 
réalisée que pour un seul &. Donc, si l’on choisit une hypothèse FH, et que 


(3.2) ait lieu pour £& donné, on obtient alors un test de risques nuls. 
Supposons maintenant que sur la trajectoire observée 


(B, (4, x(t))z, z) = (B2(4, x(t)) z, z) 


pour tous les z € R*. Alors B, (f, x(1)) = B,(1, x(r)). On peut donc admettre 
que B,(1, x) = B,(r, x) pour tous les € [0, TJet x E R". 


24,3.2. Condition d’équivalence des mesures. Supposons que y, est une 
mesure rattachée au processus observé pour l'hypothèse 47, (on admet que la 
loi de probabilité de x(0) est donnée et ne dépend pas du choix de l’hypo- 
thèse). Posons B(f, x) = Br, x) = B.{t, x), ar, x) = alt, x)— ait, x). 
Pour que les mesures u, et u. soient équivalentes, il est suffisant qu'existe 
pour tous les s, x un vecteur b(r, x) € R" tel que 


at, x) = B(e, x) be, x) 
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cl que 
r 
Î (ar, x(0)), br, A())) dt <> 


presque sûrement. Ceci étant, la densité de la mesure y, par rapport à y, 
s'écrit 


e(x(-)) = exp | Î (be, xG)), dx@))— 


r 
+ [ (b(t , AC), air, x) + a: (1, x())) 7 . (3.3) 


Soit cr, x) = (br, x), a, (1, x) + at, x)). Pour trouver la loi de proba- 
bilité de ex: )) pour l'hypothèse 47, on aura besoin de la quantité 


r 


r 
Ë, = [ (b(s, x(5)), dx(s))- + Î cs, x(s5)) ds. 


t 


Désignons par E,, l'espérance mathématique conditionnelle sachant que 
x(4) = x. Posons 


1 (£, NX) —= E, ei, 


alors la fonction «(#, x) cest solution de l'équation suivante pour f € [0, T]: 


Ou (1, x) 
ot 


+ be, x), V)] = [icte, x) + À (at, x), be, »)} u=0 (3.4) 


+ _ [CB x)V, V)+ (a, x)+ 


e 0 () Q 
(v est le vecteur de covrdonnécs ie tt gun” OÙ x!,..., A* sont 


les coordonnées du point x}. Pour # = 7° la fonction #1(1, x) vérifie la 


condition à la limite uA(T, x) = 1. 


24.3.3. Processus homogènes par rapport aux coordonnées spatiales, Sup- 
posons que a,(#, x) = af), B,(t, x) = B,(r), c'est-à-dire que les coefficients 
du processus de diffusion ne dépendent pas des coordonnées spatiales. 
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Dans ce cas le processus x(#) sera un processus à accroissements indépen- 
dants. De (3.2), il résulte que 


À(t, z) = [(B:(5) z,z)ds, 


0 


si est vraie l'hypothèse H,. On peut donc choisir presque sûrement l’une 
des hypothèses si B,(#) Z B.(t) pour un t. 

Supposons que B,(1) = B,(t) = B(t),a,(t)—a,(t) = at). Désignons 
par E l'ensemble des # € [0, 7] pour lesquels a(t) n'appartient pas au do- 
maine de valeurs de l'opérateur B(+). Soit P(+) un projecteur sur le domaine 
de valeurs de l'opérateur Z(r). Si la mesure de Lebesgue de l’ensemble E 
est positive, on peut choisir presque sûrement une hypothèse : 

si est vraie F,, alors 


r 
[IPOGG-a0))f ar = 0, 
0 

si est vraic H,, alors 


r 
FlPOGO-at) far > 0. 
0 


Supposons que pour presque tous les # le vecteur a(r) appartient au domaine 
de valeurs de l’opérateur B(t), c'est-à-dire qu'il existe un vecteur b(r) tel que 


at) = B(t)b{t) 


(pour que le vecteur b(r) soit défini de façon unique, on le choisira dans 
le domaine de valeurs de B(r) ; ceci est possible puisque B(r)est symétrique). 
On remarquera que (ar), b{t)) > 0. Une condition nécessaire et suffisante 
de continuité absolue des mesures est 


P 
f (at), b)) dt <oo. (3.5) 
0 


Si (3.5) a lieu, les mesures y, et y. sont équivalentes et la densité de y, par 
rapport à /4, est de la forme 


T r 
e(x(-)) = exp JG. dx(t))- _ Î (b(r), a;(r)+a:(t)) dt}. 
0 (1) 


Pour toute hypothèse, 1n p(x(:)) suit une loi normale de variance 
r 
f (ete), btr)) dt 
0 
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ct de valeur moyenne 


r 
_ Î (tr), be) dr pour l'hypothèse /7, ; 
0 


T7 
. [ (ae), b(r)) dt pour l'hypothèse /,. 
0 


Indiquons, de plus, un test de risques nuls sachant que 
f Ga b{(r)) dt = + oo. (3.6) 
Prenons une suite de fonctions b,(r) telle que 
f (BG) b,{r), b,(r)) dt = 1 (ar), b,(G)) dd n 
0 0 
(ceci est possible en vertu de (3.6)). On choisit l'hypothèse F7, si 


Tr tr 
lim (f (B() b,(e), b,()) at) f b,(t)d{[x()-a,(1)] = 0, 


nm —> CO 0 


ct l'hypothèse 77. dans le cas contraire. 


24.4, Test entre hypothèses relatives à la 
valeur moyenne d'un processus gaussien 


Soit x(r), 1 € [0, T}, la trajectoire d'un processus gaussien de dimension un, 
de fonction corrélative R(#, s) continue donnée. Pour l'hypothèse FH, la 
moyenne du processus est 0, pour l'hypothèse F,, c’est une fonction «(r) 
continue donnée (si pour #, la valeur moyenne est a,(r), alors on considère 
x(r)— a, (1) au lieu de x(1)). 


24.4.1. Conditions d’orthogonalité. Test de risques nuls. Désignons par 


L,[0, T] l'espace des fonctions g(1) sur [0, T}] de carré intégrable. Cet 
espace est un espace hilbertien muni du produit scalaire (g,, g:) = 


) d 
= f 810) 80) dr. 
0 


? 


Soit Rg(t) = [ RU, s)g(s) ds un opérateur linéaire dans L,(0, T]. Cet 
0 
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opérateur linéaire est complètement continue et admet une suite de valeurs 
propres et de fonctions propres {2,, ga} : 


T 


f RG, s) mas) ds = mat), 
Q 


les fonctions g, sont deux à deux orthogonales et forment un système 
complet dans le domaine de valeurs de l'opérateur R, 2, > Oet » À, <o. 

1) Si à?) ne se développe pas en une série suivant les fonctions g,(f), 
alors les mesures #, et y, rattachées au processus pour les hypothèses F, 
et F7, sont orthogonales. Voici un test : soit 


a) = a) © pt) j pa(s) a(s) d((p, pe) = 1). 


k= 1 
 d 
Si f xG&)4() dt = 0, on accepte l'hypothèse F, ; 
0 
r 


si fx(t)4()dt # 0, on prend H,. 
0 
2) Supposons que at) se développe suivant les fonctions propres y, : 


r 
dt)= D'agt), = [ at)qutr)dt. 
0 


A1 
Si 
2 . = co, (4.1) 


alors les mesures y, et y, sont orthogonales. On construit un test de la 
manière suivante : prenons une suite partielle m1, telle que 


Si 


lim (5 I DE be ROUES 


n +00 \i=1 À 


on prend l'hypothèse FH, ; si cette condition n'est pas satisfaite, on prend 
l'hypothèse FH, . 
Le test construit fait intervenir les valeurs et les fonctions propres de 
peau intégral R. On peut proposer d’autres tests n'utilisant pas ces 
onnées. 
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Soit {y:(), & - 1,2,...} un système orthonormé de fonctions dans 
L,[0, T]. Posons 


T 


xs fat)pt) dt ; 


r 


= f at)yeQ) dt ; 
0 


r r 


ra = Ef xG)nt) dif xG) y) dt 
0 0 


(l'espérance mathématique cst prise pour l'hypothèse /7,). Soit b£” une 
solution du système d'équations linéaires 


— rh, 
(d& px JE ; 
Si (4.1) cest vérifiée, alors 


lim  ÿ a bf9 = | co, 


A» © Loi 


Choisissons #1, telle que 
"mn 


D abfw in 
k=1 


Alors on obtient le test suivant : on choisit l'hypothèse F7, si 


lim (5 a, po) L x2 hf" = 0, 


ct l'hypothèse /7, dans le cas contraire. 


24.4.2, Conditions d'équivalence des mesures, Dans les notations du numéro 
précédent, une condition nécessaire ct suffisante d'équivalence des mesures 
a et 73 est 


> Li: < ©, (4.2) 


Si (4.2) a lieu, la densité de la mesure y, par rapport à la mesure y, est de 
la forme 


530 


Si l'équation de Fredholm de première espèce 
 d 
dt) = S R(T(, 5) b(s)) ds (4.4) 


admet unc solution b(r), la densité p(x(*)) peut être écrite sous la forme 
plus suggestive : 


? r 
e(xC-)) = exp ( x(s) b(s) ds [ a(s) b(s) 4 (45) 
0 0 


(on remarquera que souvent l'équation (4.4) admet une solution en tant 
que distribution et les intégrales de (4.5) peuvent être transformées en 
intégrales ordinaires par intégration par parties). La loi de In p{x(-)) est 
une loi normale de variance 


ds 


pour les deux hypothèses ; la moyenne est , 4 pour l'hypothèse F, et 


£ pour l'hypothèse F,. Si l'équation (4.4) est difficile à résoudre, on peut 


utiliser le test approché suivant. 
Supposons que 4"? sont ceux du numéro précédent. On acceptera H, 


S ÿ DE x, < À, et FA, si ÿ b£ x, > À. Ceci étant 
kE= k= 


À = CE) Va ++ des 


où 
I e(e) à 
—— le-“du=e; d,= x DE). 
7 | 2% 
De plus, 
As = €, 
| : 
e(e)+ Vên 
Comme d, —+ d = ÿ © et que pour un test optimum avec &jys = 8 
='1 À 
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on a 


La 


Maur ee“? du, 
" 4/27 | 


e(e)+ V à 


alors a«$Ÿ -> &.,. 
24.4,3, Cas de processus stationnaires. Soit R(r, s) = r(t—5s) c’est-à-dire 
A+) est un processus stationnaire pour #7,. Désignons par F(À) la fonction 


spectrale du processus. Supposons que #4 est l'espace des fonctions g() 
représentables sous la forme 


r 
gU)= [eg()dr, 
Tr 


où sont des fonctions à valeurs complexes sur [—7, T] telles que 
r 
f 1gG@)1? dt <c. Désignons l'adhérence de W, par W,(F) pour la 


CE 
métrique définie par 
gl = [18Q)F dF(). 


Pour que les mesures ye, et ye, soient équivalentes, il est nécessaire et suffisant 
que la fonction &1), 1€ [—T, T], soit représentable par 


a) = [fe b(1)dF (à), 


où b(4) € W(F). Si cette condition est satisfaite, la densité p(x(-)) est de 
la forme 


GC) = exp { (20) 0-5 [16 FR}, 6) 
où p{À) est la mesure spectrale du processus x(r) : 
x() = fe" d y(2). 


On remarquera que dans (4.6) l'intégrale stochastique peut être calculée 
comme 


r 
lim f 7U)xG) dt, 


no _r 
où y, cst une suite de fonctions telle que ||b—b,11, -> O0 si seulement 
r 


bO)= [etp,(Yat. 
FT 
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24,5. Test entre hypothèses concernant 
Ja fonction corrélative d’un processus gaussien 


On observe la trajectoire d'un processus gaussien x(#), # € [0, 7}, de dimen- 
sion un, de moyenne 0 ; on a deux hypothèses relativement à la fonction 
corrélative : pour Æ, elle est égale à R, (1, s), pour H, à R,(r, s) ; les fonc- 
tions R.(?, s) sont supposées continues. 


24.5.1. Conditions d’orthogonalité. On désignera comme toujours par 

pu la mesure rattachée au processus pour l'hypothèse F7,, k = 1, 2. On peut 

toujours supposer que ces mesures sont concentrées sur l’espace L,[0, T]. 
1) Si existe une suite de fonctions g, (4) € L:[0, T] telle que 


Tr Tr 
lim f Î RG, 5) 8,0) gts) dt ds (s [ RG, 5x 
0 


109 0 © 
—1 
x) dtds) — + 3 (5.1) 


alors les mesures y, et y. sont orthogonales. On obtient un test de risques 
nuls en choisissant une suite de fonctions w,.(#) telle que 


TT 


[ | RG s)v,4)y,(s) dt ds = 1; 


0 
T Tr 
I] f RG s)y,U)y,(s) dt ds := n. 
0 0 

On prend l'hypothèse /7, si 

Tr Tr 
REA LAOTACEL as) [ x@) y, (r) di + 0, 
0 


et l'hypothèse 77, dans le cas contraire. On construit de façon analogue 
un test dans le cas où la relation (5.1) est satisfaite par permutation des 
indices 1 et 2. 

2) Supposons qu'il existe un 9 :- 0 tel que 


TT rr 
Ô J J RG, s) gt) g(s) dr ds = [ | R,(t, 5) gt) g(s) dt ds == 
0 0 0 0 
rr 
<+ffrc s) et) g(s) dt ds. 
CR 


533 


Formons une suite de fonctions y, (1) telles que 
? Tr 


f (| RG, s)ypx(@)y,(s) dt ds — 0 pour & x j. 
0 0 
Si 


œ Tr rr 
» [ [ Ra, 5) vaQe) wa(s) dt ds (f [RG Dt)x 
0 0 0 0 


£=1 
—! 2 
XYa(s) dt as) 7 ] = +0, (5.2) 
alors les mesures y, et 1, sont orthogonales. Soient 


Tr 


(| (| RG) pG)ys) dtds - 1; 
0 0 


r 
[MAG AOTAOLICOEE ENT 
0 


© 


On obtient un test de risques nuls en prenant m1, tel que 
"y 
Sn, 
[y=s | 


et en acceptant l'hypothèse 47, si 


_ lim (5 a) ÿ L( ax) 1] Ô, = 0, 


ct l'hypothèse F7, si cette condition n'est pas réalisée. 


24.5.2. Conditions d'équivalence. En plus de R,(t, s), introduisons RE (4, s), 
fonction symétrique de carré intégrable sur [0, T]X{0, 7] vérifiant la rela- 
tion 
> 
RU, 5) — (| REG, u) RE (u, 5) du. 


Qu 


Sig® ()et 29, k = 1,2, n = 1,2,..., sont respectivement les fonctions 
et les valeurs propres de l'opérateur intégral 


T 


Reg) = Î RU, s)p(s)ds, 
0 
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alors la fonction RL=(1, 5) peut étre construite de ia manière suivante : 


En. 


REG, S) = LV) (s) (5.3) 

ni 
(la série de droite converge en moyenne quadratique sur [0, T]X(0, T}). 
Pour que les mesures y, et 71, soient équivalentes il est nécessaire et suffisant 
qu'existe une fonction D(#, s) de carré intégrable telle que 


TT 
RG, s)—R.(4, 5) = f f RUE, u) Du, v) RE (v, 5) du dv. (5.4) 
0 


Soit D(1, s) une telle fonction. Désignons par //,(1) les fonctions propres 
ct par 0, les valeurs propres de l'opérateur intégral symétrique de noyau 


Ds, s) : 
T 
SU) -- (| De, 5) 0,(s) ds. 
0 


(De (5.4) il résulte que 9, = —1). Alors la densité de la mesure y, par 
rapport à la mesure 7e, cst 


où &, sont déterminées sur le vu de la fonction observée x(1) à l’aide de 
l'égalité 
FT T 
ke ÿ ne ] q 2 (3) GS) ds ] Ok) pa) de. (5.6) 
n =i / 2 
0 O 
Pour trouver la loi de p(x(: ). il faut tenir compte de ce que les varia- 


bles &, forment une suite de variables gaussiennes indépendantes de moyenne 
0 et de variance 1 pour F4, et de variance 1 + 0, pour H,. Donc, 


sin p{r(.)) a TI (+04) 
Ec I TRMEALE 
pour l'hypothèse /7, ct 
IL (1 à)" 
(8 |" 
1 + à 


E ce" in e(rt- )}) 


pour l'hypothèse F,. 

On voit que pour trouver la densité d'une mesure par rapport à l’autre 
ct la loi de cette densité si les variances sont différentes, on est conduit à 
Chercher les fonctions et les valeurs propres d'opérateurs intégraux. Quel- 


535 


quefois il est possible d'éviter le calcul de l'opérateur D ct des quantités 
&.. Considérons l'équation 


r r 
A Î R:G, 5) ps) ds = Î Rilt, s) pts) ds. (5.7) 
0 0 


Si les mesures sont équivalentes, cette équation admet une solution (éven- 
tuellement sous forme distributionnellc) pour un ensemble À au plus 
dénombrable. Désignons par /, ces valeurs de À et par y, les solutions 
correspondantes. Alors À, = 1 +0, ct la densité "o{x(-)) s'écrit 


T 
: IIS LE 
e(x(-)) = exp | PA (re) edit. "In |] (5.8) 


Tr 
(on admet que y, sont normées de telle sorte que [ [ R:(,5)p(t)p(s)X 
0 0 


Xdi ds = ) . La solution distributionnelle de l'équation 


T Tr 


A f R, (4, s) ye(s) ds = f R, (4, s) pe (s) ds 
o 0 


cst déterminée par une suite de fonctions y£”(r), telles que 


Tr 
[ [RG D)" dt ds = 1 ; 
0 0 


r r r 2 
lim f (a [RG 5) (D) ds-[ RG, 5) pl (5) as) a] = 0. 
0 0 


RAR —+ 00 0 


24.5.3, Test entre hypothèses pour processus stationnaires. Supposons que 
x(4) cst un processus stationnaire de moyenne 0 et de fonction corrélative 
R,(t) pour l'hypothèse H,, k = 1,2. Supposons que F,() est la fonction 
spectrale du processus pour l'hypothèse 77, : 


RG)= fear, (). 


Désignons par WÂ l'ensemble des fonctions de la forme 


r 
pa, B)= [ [e+tg(s,t)ds dt, 


-T -T 
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où g(s, 2) est bornée ct mesurable sur[—7, T]X{—7T, T}. Supposons d'autre 
part que W4(F,) est l'adhérence de W# pour la norme 


lyu, = [[1yC, 8) dF;() dF,(B). 


Pour que les mesures y, et #4 soient équivalentes, il est nécessaire et 
suffisant qu'existe une fonction b{x, B) de WZ(F,) telle que l'on ait 
ReG—s)— Rs) — ff et21+18 ba, B) dF,(a) dF;(P), 
la densité s'écrit 


ex) = ef [fo Da aB+e), (69 


où }{«) est la mesure spectrale rattachée au processus x(r) : 
x() = fe dy), 


la fonction (a, B) est liée à b{x, B) par la relation b(x, B) = D(a«, B)+ 
+ I] O(a, y) by, B) 4F, (>), et l'intégrale stochastique multiple de (5.9) est 
définie par une intégrale par rapport à une mesure vsur ]— «, c [ X ]— co, col 
telle que 


vla, BX{y, D = L»6)-> IX B)-2Q@)]- Fe, BLN y, 1) 


(r (1) — I] dF, @). La constante c de la formule (5.9) se déduit à partir 
4 


de 
Î 0 
C = a, In (1:12), 


où À, sont les valeurs propres de l'opérateur 
Ve(B) = [ b(æ, B) g(a) dF() 
dans W,(F,). Signalons aussi que l'intégrale de (5.9) peut s'écrire 


2 cu [fat de) f 0) 46) f 80) 1 @ 4 F @|, 


4 —————————s 
ba, B) = D Cy£i (a) f;(B). 
.J) 


24.5.4, Test entre hypothèses concernant la densité spectrale. Supposons 
que les fonctions spectrales F,(À) possèdent les densités spectrales /,(2). 
Citons quelques conditions suffisantes d'absolue continuité ct d’orthogona- 
lité des mesures en termes de densités spectrales. 

I. Supposons que sont satisfaites les conditions : 
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1) pour des r, et €. 
CilPoQ) << 10) < Ce 170), 


où #,(À) pour s = 0 est de la forme 


GaQ) = | eXe(r) di, (S.10) 


où g(1) est une fonction de carré intégrable ; 


D [ESA T à 
Alors les mesures a et #4 rattachées à x(1), 1 € [0, T], pour les hypothèses 


H, et H, sont équivalentes quel que soit T > 0 
IT. Supposons que pour les grands | /| 


c = lAF A0) < cs, 
ect es étant positifs et & — 1. Si 


(RCE AO) TEE 
1 +4 222 


alors les mesures y, et y, rattachées à x(1), 1 € (0, T], pour les hypothèses 
H, et H, sont équivalentes pour tous les T = 0. 

IT. Supposons qu'il existe une fonction analytique entière po(À) 
de type exponentiel non supérieur à s < 7, telle que pour des 0 = ce, < €, 


l'on ait 
cr go) [f70Q) -< ca. 
Alors si 
RS Le RORPACISETCONRRTEE 
fNQ@) PAU 
T7 + ©, (5.11) 


les mesures y, ct y, sont orthogonaies. 
IV. Si /,() et /,(1) sont des densités rationnelles, alors une condition 


nécessaire et suffisante pour qu'elles soient équivalentes est que 
J1Q)° 
lim — Î 
À -> fi Q)_ 
Si lim J0) < 1, on peut construire un test de la manière suivante. 


ie J10 A 
Supposons que m est tel qu'existe la limite finie non nulle 


; TAC EN AC) ER 
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Ceci entraine l'existence des limites 
lim À!=/,(2) = a, un 12e fa) = a, (5.12) 
À — co + 00 


de plus a, +a, = a # 0, a, # a. De (5.12) il résulte que la trajectoire 
observée admet une dérivée d'ordre m—1 : (1) = xf"-0(r). La limite 


im Ÿ ( . r) (5 r)| - a. (5.13) 


A+ L:s1l 


existe presque sûrement si est vraie l'hypothèse /7,. En calculant le premier 
membre de (5.13) et en comparant avec les valeurs de a,, on peut choisir 
l'hypothèse vraie avec des risques nuls. 


24.6. Estimations des paramètres des lois 
de probabilité pour processus aléatoires 


24.6.1. Position du problème. Supposons qu'on sache de la trajectoire 
observée d'un processus x), 1€ [0, TT], qu'elle est la trajectoire d’un 
processus auquel est rattachée une mesure y sur l'espace de fonctions 
Fo, r3- Le paramètre 0 qu'il faut estimer sur le vu d'observations prend 
ses valeurs dans un ensemble paramétrique ©. Les problèmes de statistique 
des processus aléatoires sont caractérisés par le fait que ce paramètre peut 
en principe prendre ses valeurs dans un espace de dimension infinie (ce 
paramètre peut être, par exemple, la moyenne inconnue qui est suscep- 
tible d’être une fonction quelconque de F0, r). Supposons qu'il existe une 
mesure v Sur Fo, 1 Par rapport à laquelle toutes les mesures sont absolu- 
ment continues et 


Dans ce cas la famille de mesures {y0, 0 € O} est dite régulière. On admet 
que © est une variété linéaire, p(6, x) une fonction assez régulière. On 
peut alors rechercher un estimateur du paramètre 0 par la méthode du 
maximum de vraisemblance. Signalons que les conditions de régularité 
et la forme de la densité pour les processus à accroissements indépendants, 
de diffusion et gaussiens peuvent être déduites à partir des résultats des 
n° 24.2 à 24.5. 

Le cas d’une famille {y0, 0 E ©} de mesures deux à deux singulières 
cest plus intéressant (et spécifique précisément pour la statistique des pro- 
cessus aléatoires). Alors pour 0, # 0, les mesures y, et 10, sont orthogona- 
les. On conçoit donc que le paramètre 0 puisse être déterminé presque 
sûrement sur le vu d’une seule observation. Par estimateur du paramètre 
0 on entendra une fonction (x) définie sur Fo, #) à valeurs dans ©. Sup- 
posons que © est un espace métrique séparable complet (ou un borélien 
dans un tel espace). On admettra que O(x) est mesurable par rapport à la 
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tribu Ypo, 1 engendrée dans fo, #1 Par les ensembles cylindriques et que 
D est la tribu des boréliens de ©, c'est-à-dire que l'image réciproque de 
tout borélien de © est mesurable dans F0, rj. Un estimateur du paramètre 
0 est dit convergent en probabilité si 


ue{x : 0x) = 0} = 1, VOEO. (6.2) 


Si l'on peut déterminer / avec un risque nul, c'est que 0 admet un 
cstimateur convergent en probabilité. Des exemples montrent qu'il existe 
des familles de mesures deux à deux orthogonales n'admettant pas d'esti- 
mateurs convergents en probabilité. D'où l'intérêt qu'il y a à étudier le 
problème de l'existence d'estimateurs convergents en probabilité, de mème 
que leurs méthodes de construction (s’ils existent). On donne plus bas 
AUEAUES méthodes de construction des estimateurs convergents en pro- 
babilité. 


24.6.2. Méthodes de projection. Supposons que les mesures /# sont telles 
qu'existent la moyenne &(#) du processus et la fonction corrélative Ro(s, s). 
Supposons d'autre part qu'existent deux variétés linéaires L, et L, sur 
Fo, r POSsédant une intersection qui ne contient que l'élément 0, telles 
que æ(:) € L, pour tous les 0, et, si 0 est une valeur vraie du paramètre, 
que x(t) — æ(t) appartienne presque sûrement à Z.. La dernière proposition 
exprime que si g,(0, ?) sont les valeurs propres d'un opérateur intégral de 
noyau Ro(r, s), et À,(0), les valeurs propres correspondantes, c'est-à-dire 


T 


on (U) Pa (0, 1) Te f Ro(r, s) fe (0, s) ds, 


alors 
œ F ; 
2 : [ (xs) — &(s))g2(0, s) as ga(0, 1)€ La. 
=" Lo 


Supposons d'autre part que æ(-) est une bijection de © dans Z, . Désignons 
par L = L,+L, et soit P un projecteur de ZL sur L, : si z() = y,()+ 
+y.(1), où y,(r) € L, (cette décomposition est unique pour tous les z(#) € L), 
alors Pz(1) = y,(r). Sous les hypothèses faites on a 


mo({x() : Px() = œ(r)}) = 1. 


Si l'on connait æ(r), on peut déterminer le paramètre 0 en raison de la 
bijectivité de l'application @(r). Donc, le plus important dans la méthode 
de projection est de construire le projecteur P. 

Exemple. La famille de mesures 0 est une famille de mesures 
gaussiennes de moyenne 


r 
ao(e) = À BG, 5) 0(s) ds, (6.3) 
0 
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r? 
O(s) € L:[0, T], J J B°(t1, s) dt ds <<, l'opérateur corrélatif Ro(r, s) = 


= R(t,s)ne dépend pas de 6. 

Soient g,(r) et 2, les fonctions et valeurs propres d’un opérateur inté- 
gral de noyau R(r, s,). Désignons par R!/? la variété linéaire des fonctions 
z(t) de L,(0, T] de la forme z(1) = 2 a V' Ag), où Y'af<c et par 


B celles des fonctions rpéscitidles sous la forme du second membre 
de (6.3). : 
Supposons que BNR'!° = {0}. Ceci signifie que pour tous les Ü(s) 
r 


pour lesquels [ 6*(s)ds > 0,ona 
0 


r 7 : 
a ! 
2. he ( Î Br, 5) U(s) ds near = - oo, 


Munissons B + R!!° du produit scalaire : si 


en 


r 
= D œVApe()+f BG, s)U(s) ds, 
0 


alors 


CO) = Ÿ a+ j G(s) ds. 


Supposons que B(r, s) est une fonction symétrique et {y,(r), 132} 
la suite de fonctions et de valeurs propres correspondant à l'opérateur 
intégral de noyau B(1, s). Soit 


= La Vhn+T Amy, (64) 


où y a+ > PI <o, Montrons comment on peut construire l'opérateur 
P qui associe à une fonction }(#) de la forme (6.4) l'expression 


Beta pe). 


Désignons par B£? des nombres tels que l'expression 
2 


+] bo- À Pin Va (0)] Pa (0 di 
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soit minimale pour y, = f#£”. Alors B, = lim fl” et 
ñR —+ © 


Py{) = > lim {ya (r). 


Donc 
at) = Px(r), 


où x(#) est la trajectoire observée. 


24.6.3. Méthode de minimisation de la fonctionnelle quadratique. Supposons 
que la famille de mesures {19, 0€ 0} est celle du numéro précédent. 
Rappelons que dans l'exemple envisagé dans le numéro précédent l'esti- 
mateur de la moyenne a été construit par minimisation d’une suite de 
fonctionnelles quadratiques. Dans le cas général on peut considérer une 
suite de fonctionnelles quadratiques 


Tr 
K(xC)) = [ Ê KAU, s) x) xs) dt ds 
0 0 


et chercher un estimateur de la moyenne æ(t) sous forme de la limite d'une 
suite de fonctions a” (1) minimisant l'expression 


Tr 
[ SK G, s)Lx()—20)] Ux(s)—2(5)] dt ds, 
0 0 


où z(-) prend ses valeurs dans l'ensemble A7 des moyennes possibles 
{æ(-), 0€ 6). Pour que cet estimateur soit convergent en probabilité 


(en particulier, pour qu'existe la limite de a$”(r)) il suffit que soient réali- 
sées les conditions suivantes : 
1) pour 0, # 0, 
Tr 


im ff K,G, 5) [as,(r)— a, (r)] [ao,(s)— a0,(s)] di ds = + co ; 
0 


# —+ 00 0 


2) il existe une métrique p dans © telle que si (1) = x(1)—ao(r) (0 est 
la valeur vraie du paramètre), alors on a presque sûrement 


Tr 
LL KG, 5) EC) Las, (s)— ao(s)] di ds 
TT SL KSG, 5) fa.) &0)] [as,(s)— as(s)] di ds 
0 0 
uniformément en 0, tels que p(0, 0,) = €, quel que soit & > 0. Si, sous 
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ces conditions, /, est déterminé à partir de l'égalité 44° (+) — ay ( ), alors 
0, converge stochastiquement (pour la métrique @) vers 0. 

24.6.4. Méthode du maximum de vraisemblance. Considérons deux versions 
de cette méthode. 


A. Supposons que quels que soient #,, ..., #, de [0, T], les variables 
X(), ..., x(,) admettent une densité conjointe partout positive 


ER Ni NS) 
si 0 est lu vraie valeur du paramètre. Choisissons une valeur 2,0 ct 
considérons la fonction 

pe(1f, 10, x GO), ..., xG99)) 


6.5 
pa (if, 10, xGL9), …., x(E)) 


f.(0, x(-)) 7e 


(7, est une fonctionnelle de la trajectoire observée), où 
0 = 1 69 19 - TT ct max(1£ —1f),) + 0 
A 


pour 7—co, Si le processus x(1) est stochastiquement continu, quelle 
que soit la vraie valeur 0, du paramètre, alors lim /,(0, x(-)) est presque 
—+ 


sûrement nulle pour tous les 0 % 0, et égale à un pour 0 — U,. 

Soit 0, la valeur qui maximise /,(0, x(-)) (on admet que /,(0, x(-)) 
est continue en Ÿ et que Ÿ varie sur un compact). Il est naturel de prendre 
Ü, pour estimateur. Il faut étudier la convergence en probabilité de cet 
estimateur dans chaque cas. 

B. Supposons que x(#) € L,(0, T]. Considérons un système orthonormé 
de fonctions dans ZL,[0, T] : {g4(r), & = 1,2, ...}et posons 

Tr 


x = [ pa) xt) dt. 
0 


Soit p#(y1, ..., Ye) la densité conjointe des variables x,, ..., x. Si 4, 
est la vraie valeur du paramètre, alors 


PS (M ? es X,) 
———— -- R 6. 
Pa (M: LS | X,) ” 


f,(0, x(-)) = 


L'estimateur 0, est cherché comme point de maximum de la fonction 


J, A (0, x(- )). 


24.6.5. Méthode de Bayes. On se place dans les conditions du numéro 
précédent. Désignons par /,(0, x(-)) la fonction définie par l'égalité (6.5) 
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ou (6.6). Admettons que © est un ensemble ouvert convexe dans un espace 
vectoriel normé et définissons sur © une mesure borélienne » telle que la 
mesure de tout ensemble ouvert soit positive. Pour estimateur de Bayes 
du paramètre 0 prenons la suite d'estimateurs 


_ F8/.(6, xt-)) db) 
[A (, x(-)) r(dU) | 


Il faut étudier la convergence en probabilité de cet estimateur dans chaque 
cas concret. 


Chapitre 25 


STATISTIQUE DES PROCESSUS ALÉATOIRES 
STATIONNAIRES AU SENS LARGE 


25.1. Propriétés des estimateurs 
des caractéristiques des processus stationnaires 


25.1.1. Problèmes des statistique des processus stationnaires, Supposons 
qu'on observe un processus aléatoire {Ë(r), 1 € T}, et que des considéra- 
tions à priori ou un test préliminaire nous suggèrent que le processus 
{£(), 1 € T}est de la forme : 


1) () = ét), 1 ET, ou 
2) (4) = m+ê(), 1ET, ou 


3) Et) — px fat) + ÉcQr), 


où &.(#) est un processus stationnaire au sens large d'espérance mathé- 
matique nulle. 

Soit x(r), 1 € T, la trajectoire du processus &(r) observée durant l'inter- 
valle de 7, où 7, = [a, b] si ? est continu ou To = {n, K = 1, ..., n} si 
est discret. 

Dans 1), on demande sur le vu des observations de x(#), 1 € Te, d'esti- 
mer la fonction spectrale ou la densité spectrale du processus é(r). Dans 
2), la fonction spectrale du processus &,(f) étant supposée connue, on deman- 
de sur le vu des observations de x(#), 1 € T,, d'estimer la moyenne inconnue 
m. Dans 3), la fonction spectrale du processus Ë,(1) étant aussi supposée 
connue, on demande sur le vu des observations de x(#}), 1 € T,, d'estimer 


? 
les paramètres inconnus 0,, ..., 0, de la régression 4(r) — 2 dar), où 
=] 


les fonctions a,(t), & = 1, ..., r, sont supposées connues. 

Nous venons de formuler les principaux problèmes de statistique 
des processus stationnaires. D'autres variantes sont possibles, par exemple 
l'estimation préliminaire de la fonction spectrale pour l'estimation sui- 
vante de la moyenne ou des paramètres de régression. 


25.1.2. Propriétés des estimateurs, Soit A une statistique fonctionnelle de 
la trajectoire observée x(1), 1 € To : À = g(x(r), 1 € To), destinée à la réso- 
lution de l'un des problèmes posés plus haut. 

Parmi les statistiques À on choisira celles qui possèdent de « bonnes » 
propriétés, c'est-à-dire celles qui sont 

1. Linéaires, (La fonctionnelle g(-) doit être linéaire). 

2. Sans biais, Si À est la caractéristique estimée du processus 
{t(1), 1€ T}et A une statistique destinée à estimer h, alors EA = h. 
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3. Convergentes en probabilité, La statistique A doit converger en 
probabilité vers A lorsque l'intervalle des observations croit. 

4. Efficaces. La statistique ? doit être de variance minimale. 

Parfois on se contente de conditions plus faibles que la propriété 
d'être sans biais ou l'efficacité. 

2’. Asymptotiquement sans biais. EA — h lorsque l'intervalle des 
observations croit indéfiniment. 

4’. Asymptotiquement efficaces. La statistique A doit posséder une 
variance asymptotiquement minimale lorsque l'intervalle des observations 
croit indéfiniment. 

Pour vérificr qu'un estimateur converge en probabilité il suffit de 
s'assurer que sa variance tend vers 0. 


25.2. Estimateurs de la moyenne inconnue 


25.2.1. Nioyenne temporelle (estimateur de la moyenne arithmétique). 
Soit x(r), 1 ET, la trajectoire d'un processus (1) = m+Ë(t), 1€ Ti, 
où 51) est un processus stationnaire au sens large, de moyenne nulle, 
de fonction des covariances Æ(). On admet que r est continu et 7, = {a, b]. 

Parmi les estimateurs linéaires sans biais d'un processus stationnaire, 
celui qui a la forme la plus simple est l'estimateur de la moyenne arithmé- 
tique 


1 
— 4 


m — 


] “war. (2.1) 


© 


Si le processus stationnaire considéré est ergodique, l'estimateur 71 
est convergent cn probabilité. L'estimateur #1 est un estimateur de la 
moyenne #1 par la méthode des moindres carrés. 

Définissons la classe A/, des estimateurs linéaires sans biais de la 


moyenne inconnue 
ô 
M,={na: A = feux) dr}, 


où les fonctions g() appartiennent à la classe des fonctions équicontinues 
| $ 


et uniformément bornées sur {a, b] telles que (| g(t)di = 1, et xt), 1 € [a, b], 


est la trajectoire du processus {{(1), 1€ T} de densité spectrale continue 


en 0. 
Théorème 1. L'estimateur M est de variance asymptotiquement minimale 


dans la classe \,. 
Donc, ñi est le plus efficace des estimateurs A € M, pour b—a -+ co, 
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On peut obtenir une classe d'estimateurs linéaires sans biais bien 
plus large que N£, en considérant les estimateurs « pondérés » de la forme 


A= TL), a=th<ts<... <1,= b, (2.2) 

n 
où ÿ LT Vaz !. 

«= 

Soit \f, l’adhérence en moyenne quadratique de la classe des estima- 
teurs de la forme (2.2). 

Théorème 2. Dans \L, il existe un estimateur 1 unique à l'équivalence 
près de la movenne incomuie de variance minimale, et de plus 


Ext) = C, 1€f{a, b], (2.3) 


où C = inf Varfest la variance de rù. 
he, 


25.2.2. Calcul des estimateurs de la moyenne à partir d’une prédiction. 
Une méthode de construction d’estimateurs efficaces de la moyenne pour 
des processus stationnaires ergodiques repose sur l’analyse d’une prédic- 
tion établie sur le vu des observations de x(#), 1 € To = [a, b]. 

Supposons que X{(r), 1 € [a, b], est la meilleure prédiction linéaire 
sans biais des valeurs de xv(r), 1 Efa, b], c'est-à-dire E(1) = mn, 
E | &(4)—£#(4)1? = min pour tous les # € [a, b]. 

Introduisons la statistique A, définie comme la moyenne temporelle 
construite à partir de la prédiction de *{r) : pour {[a, b] € [— 4, 4] 


e b A 
À = “| Î <) dt + ( AG) dt ( £(r) a (2.4) 
— À e (2 


Pour l'estimateur linéaire sans biais »# de variance minimale on a le 
Théorème 3, 
h= dim À.,. 


4 — © 


œ 


Si les processus £,(r) est tel que ( B(t) dt < ©, on peut mettre la 


formule du théorème 3 sous une forme plus commode au calcul. 

Supposons que £,(#) est la meilleure prédiction linéaire des valeurs 
de x(r), 1 € [«, b], faite sous l'hypothèse que »1 = 0 (si s € [a, b], alors 
XoU) = (1). 

Thévrème 4, Si f B(t) dt < ©, il existe une constante d telle que 


ñn=d [ £&{)di 
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et d'est définie de façon unique à partir de la condition d'absence de biais 
En = m. 

Excmple 1. Supposons que la fonction de covariance du processus 
ë(t) = m+£,{(1) est égale à B(#) = e-°"'etnrest inconnue. 

On observe la trajectoire x(1), # € (a, b]. Si m = 0, on trouve la meil- 
leure prédiction linéaire 


£(b+rT)=e "x(b), T>0; 
Ro) = x), 1Ea,b]; 
Loa—r) = e7Sxa), Tr > 0. 


ce e b ES 
Donc “= d J Le) dt = 4 J #00) dt + | x() dt à | run = 
. » , 


- © cs e 


de) + |: v() dt + x 


La condition d'absence de biais donne 
2 0 mi mi 
m = Eh = dE + ve) dt + = d[® +m(b— a) + = * 


d'où 
Le 4 
de 2+a(b—a)' 


Donc : 
X(a) + Î (0) dt + x(b) 


s (2.5) 
2 +a(b— a) d 


nr = 


2 
Var = ————-, 
ar /ñ 2+a@— à) 
Pour la comparaison, la variance de l'estimateur #i cst 


2{e70-9 1 +a(b— col 


«{b— a)! (229) 


Var ni = 


et de plus Var nt > Var ri, LEE — 1,b—a > 00. 
Var mn 


25.2.3. Equations de type de Wiener-Hopf. Dans beaucoup de cas il 
cst possible d'obtenir une formule explicite pour la prédiction linéaire 
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sans biais # de la moyenne inconnue #1 à partir de la représentation for- 


melle 
b 


= | x) dG(r). (2.7) 
b 


b 
La fonction G(r) doit satisfaire la condition d'absence de biais f dGu) = | 


et est solution de l'équation intégrale du type de Wicner-Hopf ° 


b 
f BUS) dG(s) = C, 1€ o, b), (2.8) 


déduite à partir de (2.3) pour ce genre d'estimateur. 

Pour les processus dont la densité spectrale est une fraction rationnelle, 
l'équation (2.8) admet toujours une solution qui contient les combinaisons 
linéaires des fonctions delta de Dirac et de leurs dérivées. Cette solution 
peut être trouvée sous une forme explicite (cf. n° 25.3.3). 

Exemple 2. Dans le cas d'un processus markovien stationnaire 
l'équation 


C 
perso dG(s) = ©, 1€ [a, b], 


admet la solution 
G(1) = = Lu(t— a) + ar +utb—1)], 


«) 0, 1<0; 
{ = 
L, 1]. 


où 


b 
L'estimateur v# = f xU) 4GG) est visiblement confondu avec celui 
e 
de l'exemple 1. 
Exemple 3. Supposons que la densité spectrale du processus 
Et) est une fraction rationnelle de la forme 


_ [QG 2)" 


où Q(2) = Ÿ diz*, g, sont des nombres réels (processus d’autorégression 
&=0 


10) 


d'ordre q). 
Dans ce cas la solution de l'équation (2.8) s'écrit 


Te ü Se (do + tb 1) +8 a)]+q418b-1)- 


—0(t-a)]+ ... +981 (b-1)+(— 1}! tr a)]}, 
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où d(r) est la fonction de Dirac, # *(r) sa dérivée d'ordre 4. Donc 


b 


C e 
it = 5 do | X(t}dt + g 1) + A\{a)] : 


+\'O)-x (a)] + ... à: gx D) + (— 


où 
27 


CE Vanne". 
he Qol241 + ob — 4)] 


25.2.4, Méthode de Yaglom, Supposons que la densité spectrale du processus 
£(0) est une fraction rationnelle : 
2 


nr 
PRE Léa ÿ) 


où P(2) est un polynôme de degré p, Q(2), un polynôme de degré q, n < q 


et soit (1) =- f el di(Z) la représentation spectrale de la trajectoire 


x(s), 1E(a, b]. La méthode de Yaglom consiste à représenter le meilleur 
estimateur linéaire sans biais rñ sous la forme 


= [ q(@a,b)Q) di) (2.9) 


et à indiquer les conditions qui déterminent de façon unique la caractéris- 
tique spectrale 7,2) de l'estimateur à et qui permettent de la calculer 
efficacement. 

Théorème de Yagloum. Pour les processus dont la densité spectrale est 
une fraction rationnelle, la caractéristique spectrale qu. ;(2) dans (2.9) 
est définie de façon unique par les conditions : 

4) te, a) est une fonction entière telle que 


[IAA OI IOT LEE 


b) P(e, (4) adniet la représentation 


_ de WaU) QU) | an Wo(A) QU) 
Pan) = RG + A 1PUR ? (2:10) 
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w,(2) Q(i2) 


ACTA est une fonction analvtique dans le demi-plan sure- 


rieur, W{0) À 0 ; (4) = re 


où ÇA À) = 


une fonction analvtique dans le demii- 


plan inférieur, w(0) À 0 ; 
c) lim Ta) = 1 (condition d'absence de biais ). 
À —+ 


D'après la deuxième partie de la condition a), les fonctions w,(2) et 
w,(4) ne peuvent ètre que des polynômes de degré < p. Pour la variance 
de l'estimateur à la méthode de Yaglom nous donne 


Var = Î Fee, 2) PC) dà = 27 


(2.11) 


0 = 22 0 | 
Jo Go | 


Excmple 4. Supposons qu’un processus &(t) possède une densité 
> 
spectrale de la forme /(/) = B RS (modèle mixte d’autorégression 
et de sommation glissante). On demande sur le vu des observations de 
N(2), 1 € [a, b], de déterminer le meilleur estimateur sans biais de la moyenne 
m du processus £(r) = m1 + 50(4). 
Dans ce cas la condition b) du théorème de Yaglom donne 


(2) [42+ 15/2227 — 0°] Len n(2) [25 5 4/20 — - x] 


a( 2? + a°) 2(7° 40°) + (2.12) 


Te. (4) — e"?a 


où w,(4) et u,(4) sont des polynômes de degré = 1 dont les coeflicients 
doivent être choisis tels que les conditions a), b) et c) soient satisfaites. 
Il est plus commode de mettre le second membre de (2.12) sous la 


forme 3 
[| 
5) — pleÂl -0. Ce, mn. Ca el” 
Fa.) = € [< : ñ Lo Ci | 
4 ot a,_à Q 
te [æ+ has (2.13) 


où les coefficients cÀ, cé, £ = 0, ..., 3, restent à définir. 
La condition a) entraîne que 


cat = 0; | 
e“z+ci+e ht = 0; (2.14) 
pd 
La condition d'absence de biais donne 
3 J 
c° + +itacl + be +1 TT ÈS af: (2.15) 
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La condition b) entraîne que le coefficient en e‘“** du second membre 


de (2.13) s'annule pour 4 = ta et le coefficient en e“À pour 


4/2 
e _ +1 . e. . e 
À — 7 #, Ce qui nous donne les quatre équations qu'il faut ajouter 


à (2.14) et (2.15) pour déterminer les coefficients c£, «£, 4 = 0, 1, 2, 3. 
La résolution de ces équations nous donne 


mi — 4 (v2 sh 2 +ch #) [v(a) + x(b)] + 
0 


«Ts = ,. To : 
+a(sh 7 +V2 ch —.) | x(s) di 


— 1/24 Î ch (- x (6) al 


où Te = b—a, 
are 


_ —1 
d = [@ +270) ch 2. 4+AT, Sh 75 | ; 


21A(sh - L °,2ch © ;.) 


Var» = D 1: 
a(2+\/2aT,) ch se +#T,sh -° 


25.3, Estimateurs des paramètres de régression 


25.3.1, Estimateurs des paranètres de régression par lu méthinde des moindres 
carrés. Supposons qu'on observe un processus de la forme 


E() = 2 Our) + EN), (3.1) 


où (1) est un processus stationnaire de moyenne nulle ; a,(1),k = 1,...,r, 
des fonctions non aléatoires connues qui sont supposées être linéairement 
indépendantes, /,, & = 1, ...,r, des paramètres inconnus. Le problème 
qui consiste à trouver un estimateur des paramètres /, à partir d'une 
réalisation de x(r), / € [a, b], du processus 5(1) s'appelle problème d'estima- 
tion des paramètres de régression 


At, 0,, Ogs ..s 0,) ee à ar). 
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Dans les applications à la radiotechnique les processus stationnaires 
Ar) = AG, 0,, ..., 0,) s'appellent signal (utile), &,(r), bruit stationnaire. 
Dans les applications économiques, biologiques, sociologiques, A(t) est 
appelé trend. 

Les estimateurs linéaires sans biais des paramètres de régression qui 
ont la forme la plus simple sont les estimateurs 0, de la méthode des moin- 
dres carrés qui minimisent la fonctionnelle quadratique : 

b 
L 


Si a,(r) € L,fa, b], k = 1,...,r,alors 


L 


\() — ÿ l,ai(t) : dt. 
ks1 


r bd 
= Z cz fa) x dt, (3.2) 


Jel 


où c'est le (k, j)-ième élément de la matrice inverse de 
d 
Cxy = I] ait) ar) dt. 
Ci 


On notera que le calcul des paramètres de régression par la méthode des 
moindres carrés n’implique pas la connaissance des propriétés corrélatives 
et spectrales du processus #(r). 

Si l'on admet que la fonction spectrale F,(À) du processus &,(r) est 
absolument continue et la densité spectrale /,(2) bornée ct presque partout 
positive, on peut affirmer plus encore : L 

Théorème 1. Pour que les estimateurs U, des paramètres 0, par la méthode 
des moindres carrés convergent en probabilité, il est nécessaire et suffisant 


La 
que la fonction ar) = Year) satisfasse la condition 
1 


[RLON ECS 


—œ 


quels que soient p,, 02, ..., 0, , 
Si la densité spectrale du processus 5,(#) est une fraction rationnelle et 
si les fonctions de base a,(r) sont de la forme 


as) = e"°H"E, (3.3) 


où »1, sont des entiers non négatifs, w, des nombres réels (auquel cas 4(1) 


s'appelle régression polynomiale trigonométrique), les estimateurs 0, des 
paramètres 0, sont asymptotiquement efficaces au sens suivant. 

Soient G{(a, b) la matrice des covariances des meilleurs estimateurs 
linéaires sans biais des paramètres de régression (sa forme explicite est 


donnée au numéro suivant), G(a, b) la matrice des covariances des estima- 
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teurs 6, des paramètres 0, construits d’après la méthode des moindres 
carrés. Alors G(a, b) = G(a, b) (c'est-à-dire que G(a, b)—G{a, b) est une 
matrice définie non négative) et il existe une fonction g(r) non décrois- 
sante non négative telle que 


Jim g(b—a)G(a,b)= lim g(b—a)G(a, b) # 0. 
d—e —+ © & —e —+ © 


25.3.2. Meilleurs estimateurs linéaires sans blais des paramètres de régres- 
sion. Si la fonction spectrale F(À), donc la fonction corrélative B(r) du 
processus &,(f) sont connues, alors on admet généralement que les fonctions 
a(#) qui forment la base de la régression À(r) sont telles que le processus 


£() admet la représentation spectrale &(r) =  [ .e“444(à), où d(à) = 


= D Oje(A) dF(2)+dbo(2), Eo(2) est un processus spectral correspondant 
&E=l 


au processus ég(r) = [ e“4d65(4), «() des fonctions de carré intégrable 
par rapport à la mesure spectrale F(:) : 


Ÿ 10) If dF() < 


Qu brièvement a,(À) € L;(F)) qui sont solutions de l'équation intégrale 
u type de Wiener-Hopf : 


Î efka() dF() = ar). (3.4) 


Exemple 1. Supposons que &(r) = 0a(r)+£,(t) et que presque 
toutes les trajectoires du processus &,(f) sont continues. Si la fonction 
&t) admet une discontinuité en #, € Ja, b{, alors à partir d'une seule réalisa- 
tion x(1), # € [a, b], on peut déterminer rigoureusement la valeur du para- 
mètre 0, plus exactement l'estimateur 


0, =) EXCo+4)—x(0-— h)] 


1 
_ dto+)—@o 
converge presque sûrement pour À — 0 vers la valeur exacte de 0. L'équation 
(3.4) n'admet pas de solutions dans L,(F) pour la fonction a(r) de cet 
exemple. 
Théorème 2. Pour que les équations (3.4) admettent une solution dans 
L{F)ilest nécessaire et suffisant que 


inf | 1pG)I*dFG) # 0, 
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ou, ce qui revient au même, que 


inf } cb, — 11) > 0, 


où inf est pris sur y{À) qui sont des sonunes finies de la forme 
ÿ ce, p € T, 
J 


et telles que Lea) = 1,4=1,...,r. Si l'équation (3.4) admet une 


solution, celle-ci est unique dans L(F). 
Si l’on connait les solutions des équations (3.4), le problème de 


l'estimation des paramètres de régression se ramène à la résolution d'un 
système linéaire d'équations algébriques. 

Théorème 3. Si la fonction spectrale F() et les fonctions de base 
at), k = 1, ...,r, de la régression A(t) = D) V,ai(s) satisfont aux con- 
ditions du théorème 1 et a,(4) sont solutions des équations (3.4), alors les 
estimateurs linéaires sans biais 0, des paramètres 0,, de variances minimales, 
sont définis par les formules 


(A à Ca) JL a(2) dé), (3.5) 


où (À) est la représentation spectrale de la trajectoire x), 1€ (a, b], Qi 
—Ccov (6,, 0,) le (Ky)- ième élément de la matrice C, inverse de la matrice 


D = {dpyk,j = 1,...,r} où 
dy = Î (À) (A) «,() di. 


Si C, est la matrice des covariances des estimateurs linéaires sans 
biais différents de 0, k = 1,...,r, définis par l'égalité (3.5), alors C <C, 
au sens que la matrice C, — Cest définie non négative. 


25.3.3, Résolution des équations du type de Wiener-Hopf lorsque les densités 
spectrales sont des fractions rationnelles. Dans le cas pratique le plus 
important où la densité spectrale / (À) du processus &,(r) est une fraction 
rationnelle, c'est-à-dire que 

P(i) |? 


fQ) = Q(i) 


où P(z) = À part Q(z) = È qz*, p < q, la solution des équations (3.4) 


et avec elle celle du Droblèine dé estimateurs des paramètres de régression 
peuvent être trouvées sous une forme explicite. 
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Théorème 4. Si les polynômes P(2) et Q(2) possèdent des zéros unique- 
ment dans le demi-plan de gauche, si aucune des racines du polynôme P(2) 
n'est imaginaire pure et si les fonctions a (1), k = 1, , , satisfont les 
conditions du théorème 1, alors la solution a;(?) de l' équation 


© 


( eu, (À) | FA | d}, = aj{t) 


est de la forme 
n—- m—Î1 a-m—]1! 
a(À) = el È (52) + e/2 Z (À) + Î eXc,(t) dt, 
0 “0 8 
à ct) = Q È Q d (#), v(t) est solution de l'équation diffé 
on Ci = 2x (5) (- di 7) VAUT), VE est S 0, € qua ion € 


rentielle 


P(+) P(- æ (9) = a), 1€ Ja, b, 


avec les conditions aux limites 


im Pr O( - +) v(t) = mr Fr O(F) va(t) = 0, [= 0,...,m-—1; 
ce = du H D. a - +) var) ; 


| e d 
lim à. C0 a0(7) m0. 


Imjtmt+i 


25.4. Estimateurs de la densité spectrale 
et de la fonction spectrale de suites stationnaires 


25.4.1. Périodogramme. Soient {£(r), ? € T} une suite aléatoire stationnaire 
au sens large (une série temporelle), x(t), 1€ To la trajectoire du pro- 
cessus Ë(r), où To = {n, k = 1,...,n}, nn ET. 

A la base de la plupart des ciimaiaues de la fonction et de la densité 
spectrales du processus {ê(r), 1 € T} on retrouve une statistique appelée 
périodogramme et définie par l'égalité 


1 2 
LO) = 3 | E | x(r)e"2 (4.1) 
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Remarque. Pour les processus à temps continu, le périodogramme est 
défini comme 


| à E 


J x(0)efà di 


| 
Le, (A) = 2 - a) (4.2) 


où x(4), 1€ [a, b], est la trajectoire du processus stationnaire étudié. Les 
résultats énoncés plus bas possèdent des analogues continus. 
Si /(2) est la densité spectrale du processus &(s), 2 € T, alors 


lim EZ (à) = SO), (4.3) 


nn —> 


c'est-à-dire le périodogramme est un cestimateur asymptotiquement sans 
biais de la densité spectrale. Mais 


2/0), À = À = 0; 
lim cov EAU) 1,(2)] cs f°0), À, = da 7 À; (4.4) 
re 0, A # 2 


c'est-à-dire que le périodogramme n'est pas un estimateur convergent en 
probabilité pour la densité spectrale. 

Le périodogramme /,() traité comme un processus aléatoire par 
rapport à À possède, en vertu de (4.4), des trajectoires fortement aléatoires. 


25.4.2. Estimateurs de la fonction spectrale. Supposons que 
2 
F0) = [ 2,() dye (4.5) 
7 
et que F(2) est la fonction spectrale du processus £(r), 1 € T. La statistique 
Ë. (à) est un estimateur asymptotiquement sans biais pour la fonction 
spectrale F(4) : 2 
lim EF,(2) = F(). (4.6) 


n + © 


Si (4), 2 ET, cest un processus ergodique, alors la statistique Ë,(à) 
est un estimateur convergent en probabilité pour la fonction spectrale : 


ceci justifie la définition de F.(à) comme unc fonction spectrale empirique. 
Si F(2) est absolument continue, alors 


lim sup |7,(4)-F()| = 0. (4.7) 


n-e À 


Soient &(r), 1 € T, une suite stationnaire régulière, (1) — Y cb —RKk) 
LET 
sa représentation sous forme d’un processus de sommation glissante, 
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À 
E#(r) = 0, Et*(r) = 1. Posons F2) — j 1,0) du, F9(2) = j Se) du, où 


f(A) est la densité spectrale du D iobéasus Et), 1 ET. 
Théorème 1. Si: a) £(r) possède un moment fini d'ordre quatre y, ; 


b) S(2) est absolument continue ; c) €, = O(KP), B = à , dors 


lim à max AIOTET cu) | 27 | max . PA) 2& : 
0 À< 7 0 -: À = 
(4.8) 


où À) est un processus gaussien tel que Er?) = 0, Ex) ru) = 
mla (2, y:) 


= (3) FO) Fu) + 27 (| JS) ds. 


0 
L'égalité (4.8) rappelle le résultat correspondant pour la statistique 
de Kolmogorov avec cette différence que dans le cas envisagé la loi limite 
dépend de la fonction à estimer. 


25.4.3. Estimateurs de lu densité spectrale. Pour estimateur ponctuel de la 
densité spectrale / (À) de la suite stationnaire Si ET} sur le vu des 
observations de x(1), € To = {t, K — 1, ..., n}, on choisit une statisti- 
que 7, (2) de la forme 


LG) = j W,. (4-10) Lu) dn, (4.9) 


— 1 


où Z,(4) est le périodogramme, et les fonctions de poids #,(4), dites 
fenêtres spectrales, sont choisies telles que 
1) W, (4) admette un maximum strict en 0 ; 
nr 


D RACTIESTE 


— 1 
3) Var Z.(4) — 0 pour n— co, 
La condition 1) « découpe » l'estimateur de la fréquence cherchée 
qui, en vertu de 2), est asymptotiquement sans biais, et, en vertu de 3), 
convergent en probabilité. 


Si 
1) {G), 1€ T} est un processus régulier et (rs) = ) cé(t—k) est sa 
Per 


représentation sous forme d'une sommation glissante ; 
2) EË*%{1) = 1, EE) < oo ; 
3) © = UTIE @ +8) pour un » :- 0 ; 

W2°(u) 


1V2°(0) 


| ds : è 
if. pour n-e et [plz  , où WE (y) — 
n 
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= W,.(u)* W,. (Ge) et cest une constante positive, alors la statistique /,(/) est 
asymptotiquement normale de moyenne 


EL 
Ef.(2) = Î W(À— 0) [U) dn+o("") (4.10) 
EL 
et de variance 
71 2 5 1 
Var Z,() + ® ] WÈ(2— y) Je) du = ue | WE) du. (AU) 


1 —A 


La statistique /,(2) est convergente en probabilité pour f() si 


bu 
lim ï. J W2(2) di = 0. 
EL 
Dans l'ensemble des fonctions de poids #,, (2) ilexiste une classe qui 
est le plus souvent utilisée dans les applications pratiques, c'est la classe 
des fonctions admettant la représentation 


n—-i 
W,()=2 D ke”, (4.12) 
i 


—#nt 
où £, (7) = (=). {m,) est une suite croissante indéfinie d'entiers positifs 


telle que “ —+ 0,n-> co, K(x) une fonction paire bornée telle que £(0) =— 1, 


Ik(x)1 < 1 pour x #0, f K%x) dx = ©. 


Supposons que la suite stationnaire £(r) est régulière, que £(r) = 


= D cè(—Kk) est sa représentation sous forme d'une sommation glis- 
k--0 


sante, Ÿ leel — , que les variables aléatoires indépendantes £(1) sont 
0 


de moyennes nulles et de moment d'ordre quatre fini. Supposons d'autre 
part que Z(r) est la fonction de corrélation de {(r). 

Le théorème suivant nous donne une idée sur le comportement asymp- 
totique du biais / (À) - E/,(}). 

Théorème 2. Si 

1) la limite 
1—4(x) 


' 2-60 BAL 
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existe et est finie pour un q — À ; 
2) da n 
— —+ O0 + O© : 
ni » » 
3) 3, 14 B(r)1 < , 
Er 
alors 


lim »#(/(2)-- E/,()] EE % D HAL B(r)e"} < ©, (4.13) 
N —> 1€ 


Le théorème suivant décrit les propriétés asymptotiques de covariance 
des statistiques /.(À). 
Théorème 3, 
lim a cov LA), Z(A:2)] = 
fHa#ta; 


JG) [ éUd, h=+h= A #0; 


= © 


2/4) [ MOdr, = =0, +. 
Dans les conditions du théorème 2, la plus rapide convergence de la variance 
Var FAO) vers O a lieu pour 


SE 
nl, = (nr) | 


25.4.4. Exemples de fonctions de poids W, (4). Soit Br) = _ DETE 
=1 


un estimateur de la fonction corrélative B(1)(B,(1) est une fonction 


corrélative empirique). 
1. Transformée de Fourier à support borné (estimateur de Daniels) 


m, 1. 
n° [AI mn, , 
W. (2) = 
0, | AI 2. = ’ 
mt, 


__ sin 7x 


. 1 
a ms. ls] SU, à. 
2,0) = 5x y . (1 -—) BG) —— 7, k(x) 
+ L] 
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2. Estimateur tronqué 


2 11 n 
W, (2) = RE RE 
sin 2 
rs | v ll “À 
F0 = (1-7) Be 
kGX) = 1 Ixl < 1 ; 
VE To lxl>1. 
3. Estimateur de Bartlett 
… 2 MnÀ 
sin à 
1, (2) EU y , 
ni, sin? = 
= Le F1) 4 
J,() sr 2 (1-2) (1- B,{t)e" 
1—]x,, Ixl<i 
K(X) = 
@) 0,  [x|=—0. 


4. Estimateur de Tukey-Hanning 
1 , 7 
À) = HO rs A(s- mi, 7.) ee A(at à), 


mi, 


où /:(2) est l'estimateur tronqué de l'exemple 2 : 

| 

— (1 +cos 7x), xt<l; 

= | 2 d ui [xl 
0, [xt > 
25.5. Estimatcurs des paramètres 
de la densité spectrale 
supposons qu'on observe la trajectoire x(?), # € Ti, d'un processus station- 
naire {£(r), 1 € T}, Ef(r) = 0, Var £(r) = 0°, dont la densité spectrale cst 
connue à un ou plusieurs paramètres près appartenant à un ensemble de 
paramètres © : 
10) = /Q,09), 0€. 


Il faut estimer o° et 0€ O6. 
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Si le processus (4), 1€ T, est régulier pour tous DE © et si Er) == 


== » c(0) é(t—K) est sa représentation sous forme d'une sommation 
&=0 


glissante, alors pour cestimateurs #2 ct 0, des inconnues u? et 9 on peut 
prendre les valeurs de 42 et 0, qui réalisent le minimum de l'expression 


: W,(0, x(4), 1€ To) 


n In 0° ‘ (4.14) 
q° 
, = 14 | Ï 
AU : = 0 11- - = — 
où W,(/, x), 1€ To) = n 2 W(s, )(: . ] 8.0) : B,(t) er 


nm -! 

X ÿ x, D AG) est une fonction corrélative empirique ; #(s, 9) le 
j=1 

cocfficient en z' dans la série de Laurent de la fonction v{(z, 0) = 


I = : 
= ———- —— .,0(2, 0) = Ÿ c(0)zt (on admet que ce développement 
u(z, 0) u( > , o) tu 
cest possible dans un anneau contenant le cercle unité). 
Théorème 1. Si 


1) les variables aléatoires £(t) qui interviennent dans la représentation 
du processus (+) sous forme d'une sommation glisssante sont indépendantes, 
de même fonction de répartition et possèdent des moments d'ordre quatre 
finis ; 

2) l'ensemble des paramètres © est compact dans un espace euclidien 
KR! de dimension k,0 = (0,03, ..., 0x) ; 

3) lez, 0,)P % Lez, 02) pour presque tous les 121 — 1,0,,0,€0, 
(), # 0, : 

Ù 2: | | 
4) JC, 0) et [7 (2, 0) sont continues sur {— 7, 7}, alors les estimateurs 
02 et 0, sont convergents en probabilité pour 6° et 0. 

I 
- . possède 
EAU) 
des dérivées continues par rapport à 0, jusqu'à l'ordre trois compris au 
voisinage de la valeur vraie 0, du paramètre M et 


Si, de plus, est réalisée la condition : 5) la fonction 


D kle(o)| < 0, 
A1 


. | 

alors la loi du vecteur (0,0) converge pour +0 vers une loi 
V/n 

normale de moyenne nulle et de matrice des covariances G;!, où G, est 


la matrice d'éléments 
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a , Ôln [u(e#, 9)|* On |u(e', 0) ) 
un PRE HR “on 


(,m = 1,...,k) (on admet que G, est non dégénérée ). 
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L'ouvrage de V. Pougatchev, membre correspondant de l'Académie des 
Sciences de l'U.R.S.S., consiste à présenter les bases de la théorie des 
probabilités et de la statistique mathématique. Les cinq premiers chapitres 
présentent les éléments de la théorie des probabilités de manière rigoureuse, 
en termes de variables aléatoires de dimension finie, avec l'appareil de l’a- 
nalyse mathématique et de l'algèbre linéaire. Les cinq chapitres suivants 
traitent des bases de la statistique mathématique: estimation des paramètres 
de répartition, des densités de probabilité et des fonctions de répartition, 
théorie générale des estimations, méthodes de construction des modèles 
statistiques, méthode des approximations stochastiques, analyse régressive, 
dispersionnelle, modèle d'autorégression, modèles factoriels, modèles de 
reconnaissance et modèles des processus de prises de décision. Il est procédé 
à une comparaison entre les problèmes de reconnaissance et les problèmes 
de tests des hypothèses. 
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